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PREAMBULO 


Mucho nos complace que la segunda edición de nuestro 
libro haya sido traducida al español por el profesor 
Hugo Finsterbusch. Esperamos que esto pueda con- 
tribuir de alguna manera a la formación matemática 
de los estudiantes del mundo de habla española. 


KENNETH HOFFMAN 


Prólogo 


Nuestro propósito original al escribir este libro fue proporcionar un texto para el curso 
universitario de álgebra lineal en el Instituto Tecnológico de Massachusetts. Este curso 
fue diseñado para.la especialidad de matemática en el nivel medio, aun cuando tres cuartas 
partes de los estudiantes eran de otras disciplinas científicas y tecnológicas que iban desde 
el primer año universitario hasta estudiantes avanzados. Esta descripción del auditorio 
del MIT para el texto se conserva, en general, hasta el presente exacta. Los diez años trans- 
curridos desde la primera edición han visto la proliferación de cursos de álgebra lineal a 
través del país, y han brindado a uno de los autores la oportunidad de enseñar la materia 
básica a una variedad de grupos en la Universidad de Brandeis, Universidad de Washington 
(St. Louis) y en la Universidad de California (Irvine). 

Nuestro principal propósito al revisar el Algebra Lineal ha sido incrementar la variedad 
de cursos que pueden ser dictados con ella. Por un lado hemos estructurado los capítulos, 
especialmente los más difíciles, de modo que haya varios puntos terminales a lo largo del 
desarrollo, permitiendo al profesor en un curso de un cuatrimestre o de un semestre ejer- 
citar una cantidad considerable de posibilidades en la elección del tema. Bor otra parte 
hemos aumentado la cantidad de material en el texto, de modo que pueda usarse para un 
curso anual intensivo en álgebra lineal e incluso como libro de referencia para matemáticos. 

Los mayores cambios se han hecho en el tratamiento de las formas canónicas y de los 
espacios con producto interno. En el capítulo 6 ya no se comienza con la teoría general 
que fundamenta la teoría de las formas canónicas. Primero se tratan los valores propios 
en relación con los teoremas de triangulación y diagonalización, y luego se prepara el ca- 
mino hacia la teoría general. El capítulo 8 se ha dividido.de modo que el material básico 
de espacios con producto interno y diagonalización unitaria sea seguido por el capitulo 9 
que trata de las formas sesquilineales y de las propiedades más complicadas de los opera- 
dores normales, incluyendo operadores normales en espacios reales con producto interno. 

Se ha hecho también un número de pequeños cambios y perfeccionamientos de la pri- 
mera edición. Pero la doctrina básica que la inspira no ha cambiado. 

No hemos concedido atención particular al hecho de que la mayoría de los estudiantes 
ho estén primariamente interesados en matemática, pues creemos que un curso de esta 
disciplina no debe atiborrar de técnicas al estudiante de ciencia, ingeniería O ciencias so- 
cuales, sto procurarle la comprensión de los conceptos matemáticos básicos. 


viii Prólogo 


Por otro lado. bomos conscientes del amplio campo de conocimientos previos que los 
estudiantes debieran tener y, en particular, del hecho de que los estudiantes han tenido 
muy poca experiencia con el razonamiento matemático abstracto. Por esta razón se ha 
evitado introducir demasiadas ideas abstractas muy al comienzo del libro. Además se ha 
añadido un Apéndice que introduce o analiza ideas básicas tales como las de conjunto, 
funciones y relación de equivalencia. Hallamos de mayor utilidad tratar de estas ideas en 
forma independiente, pero aconsejando a los estudiantes leer el Apéndice cuando ellas 
aparezcan. 

A lo largo del libro se ha incluido una gran variedad de ejemplos de los conceptos im- 
portantes que aparecen. El estudio de todos los ejemplos es de fundamental importancia 
y tiende a minimizar el número de estudiantes que repiten definiciones, teoremas y demos- 
traciones en orden lógico sin comprender el significado de los conceptos abstractos. Este 
libro contiene también una amplia variedad de ejercicios graduados (alrededor de seis- 
cientos) que varían desde aplicaciones rutinarias hasta otros dirigidos a los mejores es- 
tudiantes. Estos ejercicios pretenden ser una parte importante del texto. 

El capítulo 1 se refiere a los sistemas de ecuaciones y sus soluciones mediante operaciones 
elementales por filas de las matrices. Ha sido nuestra práctica dedicar alrededor de seis 
clases a esta materia. Ello muestra a los estudiantes un bosquejo de los orígenes del álgebra 
lincal y una técnica de cálculo necesaria para comprender los ejemplos de las ideas abstractas 
que aparccen en los capítulos posteriores. El capítulo 2 se refiere a los espacios vectoriales, 
subespacios, bases y dimensión. El capítulo 3 trata las transformaciones lineales, su ál- 
gcbra y su representación por medio de matrices, como también, del isomorfismo, de fun- 
ciones lincales y de espacios duales. El capítulo 4 define el álgebra de los polinomios sobre 
un cuerpo, los ideales en tal álgebra y la factorización prima de un polinomio. También 
trata sobre raíces, fórmula de Taylor y fórmula de interpolación de Lagrange. El capítulo 5 
desarrolla los determinantes de matrices cuadradas y el determinante visto como una fun- 
ción alternada n-lineal de las filas de una matriz, para seguir con las funciones multilineales 
en módulos como el anillo de Grassman. Lo referente a módulos coloca el concepto de 
determinante en un marco más amplio y completo que el que usualmente se encuentra en 
textos elementales. Los capítulos € y 7 contienen un estudio de los conceptos que son básicos 
piu el analisis de una transformación lineal en un espacio vectorial de dimensión finita, 
el amalisis de valores propios, las transformaciones triangulables y diagonalizables, los 
conceptos de las partes diagonalizables y nilpotentes de una transformación general y las 


formas canónicas racional y de Jordan. Los teoremas de descomposición primaria y cíclica 
juegan un papel centra); a la última se llega a través del estudio de los subespacios admi- 


sibles. El capítulo 7 incluye un análisis de las matrices sobre un dominio polinomial, el 
cálculo de factores invariantes y divisores elementales de una matriz, y el desarrollo de la 
lorma canónica de Smith. El capítulo termina con un estudio sobre los operadores semi- 
simples, para completar el análisis del caso de un operador. El capítulo 8 trata con algún 
detalle los espacios con producto interno de dimensión finita y cubre la geometría básica, 
relacionando la ortogonalización con la idea de la «mejor aproximación a un vector» y 
con los conceptos de proyección ortogonal de un vector sobre un subespacio y el com- 
plemento ortogonal de un subespacio. También trata de los operadores unitarios, 
y culmina con la diagonalización de operadores autoadjuntos y normales. El capí- 
tulo 9 mtroduce las formas sesquilineales, las relaciona con los operadores positivos y 
auloadjuntos en un espacio con» producto interno, sigue con la teoría espectral de opera- 
dores normales y luego en resultados más complejos relativos a operadores normales en 
espacios reales o complejos con producto interno. El capítulo 10 examina las formas bi- 
Imcales, insistiendo en las formas canónicas para las formas simétrica y antisimétrica, 481 
como en los grupos que preservan formas no-degeneradas, especialmente los grupos orto. 
sonal, unitario, scudo-ortogonal y de Lorentz 
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Se estima que cualquier curso que use este texto deberá cubrir completamente los ca- 
pitulos 1, 2 y 3 con posible excepción de las secciones 3.6 y 3.7 que se refieren al doble dual 
y a la traspuesta de una trasformación lineal. Los capítulos 4 y 5, sobre polinomios y de- 
terminantes, pueden tratarse con grados diversos de minuciosidad. En efecto, los ideales 
de polinomios y las propiedades básicas de los determinantes pueden cubrirse en forma 
bastante esquemática sin afectar el desarrollo lógico del texto; sin embargo, nos inclinamos 
a tratar estos capítulos cuidadosamente (excepto los resultados referente a módulos), porque 
la materia ilustra muy bien las ideas básicas del álgebra lineal. Un curso elemental puede 
ser ahora concluido elegantemente con las cuatro primeras secciones del capítulo 6, junto 
con el capítulo 8 (nuevo). Si las formas racional y de Jordan han de ser incluidas, es nece- 
'sario abarcar una extensión mayor del capítulo 6. 

Quedamos muy reconocidos a todos aquellos que contribuyeron a la primera edición, 
especialmente a los profesores señores Harry Furstenberg, Louis Howard, Daniel Kan y 
Edward Thorp, a las señoras Judith Bowers, Betty Ann (Sargent) Rose y a la señorita Phyllis 
Ruby. Queremos además dar las gracias a los numerosos estudiantes y colegas cuyos pene- 
trantes comentarios llevaron a esta revision, y al personal de Prentice-Hall por su paciencia 
para tratar con dos aut rps atrapados en los laberintos de la administración académica. 
Finalmente, gratitud especial debemos a la señora Sophia Koulouras por su pericia y ago- 
tador esfuerzo en escribir ja máquina el manuscrito revisado. 


K. HOFFMAN y R. KUNZE 
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I. Ecuaciones lineales 


1.1. Cuerpos 


Suponemos al lector familiarizado con el álgebra elemental de los números 
reales y complejos. En una gran parte de este libro las propiedades algebraicas 
de los números que se usarán se deducen fácilmente de la siguiente breve lista 
de propiedades de la adición y de la multiplicación. Se designa por F el con- 
junto de los números reales o el conjunto de los números complejos. 


1. La adición es conmutativa, 


TF YY 
para cualquiera x e y de F. 
2. La adición es asociativa, 
t+(y+2)=(+Yyw+2 
para cualquiera x, y y z de F. 
3. Existe un elemento único O (cero) de F tal que x + 0 = x, para todo 
ven FÉ. 
4. A cada x de F corresponde un elemento único (—x) de F tal que 
ro E(—=v)=0. 
5. La multiplicación es conmutativa, 
TY = Yz 
para cualquicra x e y de F. 
O. La multiplicación es asociativa, 
r(yz) = (1y)z 
para cualquiera a, y y 2 de f. 


He 


Alechra lima! 


7. Existe un elemento no nulo único de F tal que xl = x, para todo 
x de F. 

8. A cada elemento no nulo x de F corresponde un único elemento y 
lo 1/x) de F tal que xx"?! = 1. 

9. La multiplicación es distributiva respecto de la adición; esto es, x(1 + 
2) = xy + xz, para cualesquiera x, y y z de F. 


1 


Supóngase que se tiene un conjunto F de objetos x, y, z, ... y dos opera- 
ciones sobre los elementos de F como sigue; la primera operación, llamada 
adición, asocia a cada par de elementos x, y de F un elemento (x + y) de F; 
la segunda operación, llamada multiplicación, asocia a cada par x, y de F un 
elemento xy de F; y estas dos operaciones satisfacen las anteriores condicio- 
nes (1)-(9). El conjunto F, junto con estas operaciones, se llama entonces cuerpo. 
Hablando aproximadamente, un cuerpo es un conjunto, junto con algunas ope- 
raciones sobre los elementos de éste, que se comportan como la adición. sustrac- 
ción, multiplicación y división correntes de los números en el sentido de que 
obedecen a las nueve reglas del álgebra dadas anteriormente. Con las opera- 
ciones comunes de adición y multiplicación, el conjunto C de los números com- 
plejos es un cuerpo, como lo es el conjunto R de los números reales. 

En la mayor parte de este libro los «números» que se usan pueden ser los 
elementos de cualquier cuerpo F. Para permitir esta generalidad se usará la 
palabra «escalar» en vez de «número». No perderá mucho el lector si siempre 
presupone que el cuerpo de los escalares es un subcuerpo del cuerpo de los 
números complejos. Un subcuerpo de un cuerpo C es un conjunto F de números 
complejos que es a su vez un cuerpo respecto de las operaciones usuales de 
adición y multiplicación de números complejos. Esto significa que el O y el 1 
están en el conjunto F, y que si x e y» son elementos de F, también lo son 
(x + y) —x, xy, e x ? (si x * 0). Un ejemplo de un subcuerpo semejante 
es el cuerpo R de los números reales; en efecto, si se identifican los números 
reales con los números complejos (a + ¿b) para los que b = 0, el 0 y el 1 del 
cuerpo complejo son números reales y si x e y son reales, también lo son (x + y), 
—x, xy y x"* (si x + 0). Daremos otros ejemplos más adelante. Lo peculiar 
de los subcuerpos en nuestro estudio es esencialmente lo siguiente: Si se está 
operando con escalares que forman un+cierto subcuerpo de C, entonces la eje- 
cución de las operaciones de adición, sustracción, multiplicación o división 
con estos escalares no se salen del subcuerpo dado. 


Ejemplo 1. El conjunto de los enteros positivos*: t, 2, 3, ... no es un sub- 
cuerpo de C por varias razones. Por ejemplo, O no es un entero positivo; para 
ningún entero positivo n, es —n un entero positivo; para ningún entero po- 
sitivo n, excepto 1, es 1/n un entero positivo. 


Ejemplo 2. El conjunto de los enteros: ..., —2, —1,0,1,2,..., no es 
un subcuerpo de C, porque para un entero n, 1/n no es entero al menos que 


* El autor llama «enteros positivos» los enteros l!, 2, 3, ... y excluye el 0. Hoy no es esto asi, 
pues se incluye el O entre los enteros positivos («naturales»). 
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nsca lo —1!. Con las operaciones usuales de adición y multiplicación, el con- 
junto de los enteros satisface todas las condiciones (1)-(9), con excepción de 
la condición (8). 


Ejemplo 3. El conjunto de los números racionales, esto es, números de 
la forma p/q, donde p y q son enteros y q + O, es un subcuerpo del cuerpo de 
los complejos. La división que no es posible en el conjunto-de los enteros es 
posible en el conjunto de los números racionales. El lector interesado debería 
verificar que cualquier subcuerpo de C debe contener a todo número racional. 


Ejemplo 4. El conjunto de todos los números complejos de la forma x+ »y/2, 
donde x e y son racionales, es un subcuerpo de C. Se deja al lector la compro- 
bación. 


En los ejemplos y ejercicios de este libro el lector deberá suponer que el 
cuerpo considerado es un subcuerpo de los números complejos, a menos que 
expresamente se establezca que es un cuerpo más general. No queremos volver 
sobre este punto; sin embargo, se debe indicar por qué se adopta tal supuesto. 
Si F es un cuerpo, es posible a veces sumar la unidad 1 a sí misma un número fini- 
to de veces y obtener 0 (véase el Ejercicio 5 de la siguiente Sección 1.2): 


14+1+---+1=0, 


Esto no sucede en el cuerpo de los números complejos (ni en ningún subcuerpo 
suyo). Si ello sucede en F, entonces el menor n, tal que la suma de los n unos 
es 0, se llama: característica del cuerpo F. Si ello no sucede en F, entonces (por 
alguna extraña razón) F' se llama un cuerpo de característica cero. A menudo, 
cuando se supone que F es un subcuerpo de C, lo que se quiere garantizar es 
que F es un cuerpo de característica cero; pero, en una primera exposición 
del álgebra lineal, es preferible no preocuparse mucho con respecto a carac- 
terísticas de cuerpos. 


1.2. Sistemas de ecuaciones lineales 


Supóngase que F es un cuerpo. Se considera el problema de encontrar n 
escalares (elementos de F) x,, ..., X, que- satisfagan las condiciones 


Ant + Arte + + AintTn = Y1 
Anti + Ate + "+ AznTn Ya 


l 


(1-1) 
ÁAmtr + Á m202 + +: + AmnTn — Um 


donde y;, .--, my Aiyy 1<1i<m, 1 <j< n, son elementos de F. A (1-1) se 
le lama un sistema de m ecuaciones lineales con rn incógnitas. Todo n-tupbie 
(X1, - - - , Xx.) de elementos de F que satisface cada una de las ecuaciones ae (1-1) 
se llama una solución del sistema. Si y, = y) =-*** = Ym = 0, se dice que el 
sistema es homogéneo, O que cada una de las ecuaciones es homogénea. 


Alvebra lineal 


Tal vez, la técnica fundamental para encontrar las soluciones de un siste- 
ma de ecuaciones lineales, es la técnica de eliminación. Se puede ilustrar esta 
técnica en el sistema homogéneo 

20 — DM+ 2m=0 
1 + 322 + 4x3 =0. 


Si sumamos (—2) veces la segunda ecuación a la primera, se obtiene 


— 12 — T23 = ( 
U SEA, Xx, = —X3. Si se suma tres veces la primera ecuación a la segunda, se 
obtiene 
11 + Vx3 = (0 
O Sea, x, = —X3. Así, se concluye que si (x,, x,, x3) es una solución entonces 
Xx = X= —X3. A la inversa, se puede fácilmente verificar que toda terna 


de esa forma es una solución. Así, el conjunto de soluciones consta de todas 
las ternas (—a, —a, a). 

Se han encontrado las soluciones de este sistema de ecuaciones «eliminan- 
do incógnitas», esto es, multiplicando las ecuaciones por escalares y sumándo- 
las luego para producir ecuaciones en las cuales algunas de las x, no están pre- 
sentes. Deseamos formalizar ligeramente este proceso de modo que se pueda 


entender por qué opera y para así poder llevar a cabo los cálculos necesarios 
para resolver un sistema de manera sistemática. 

Para el sistema general (1-1), supóngase que seleccionamos m escalares 
Ci, --- > Cp, que se multiplica la j-ésima ecuación por c, y que luego se suma. 
Se obtiene la ecuación 


(GAn + +++ + CmÁmdl + +++ + (C1Ar + +++ + CmÁAmn)En 
= CY + *** + CmYm. 


1 tal ecuación se la llama combinación lineal de las ecuaciones (1-1). Evidente- 
nente, cualquier solución de todo el sistema de ecuaciones (1-1) será también 
:olución de esta nueva ecuación. Esta es la idea fundamental del proceso de 
liminación. Si se tiene otro sistema de ecuaciones lineales 


Bum + +++ + Binta = 4 
(1-2) : oro: 
Biz, + e... + BitTn = Zk 


en que cada una de las k ecuaciones sea combinación lineal de las ecuaciones 
de (1-1), entonces toda solución de (1-1) es solución de este nuevo sistema. 
Evidentemente puede suceder que algunas soluciones de (1-2) no sean solucio- 
1es de (1-1). Esto, claro está, no sucede si cada ecuación en el sistema original 
ss combinación lineal de lastecuaciones en el nuevo sistema. Se dirá que dos 
¡istemas de ecuaciones lineales son equivalentes si cada ecuación de cada sis- 
tema es combinación lineal de las ecuaciones del otro sistema. Podemos en- 
tonces establecer formalmente estas observaciones como sigue 
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Teorema 1. Sistemas equivalentes de ecuaciones lineales tienen exactamen- 
te las mismas soluciones. 


St se quiere que el proceso de eliminación para encontrar las soluciones 
de un sistema como (1-1) sea efectivo, entonces se debe buscar, formando com- 
binaciones lincales de las ecuaciones dadas, cómo se obtiene un sistema equi- 
valente de ecuaciones que sea más fácil de resolver. En la próxima sección se cstu- 
diará un método para hacerlo. 


Ejercicios 
l. Verificar que el conjunto de números complejos descritos en el Ejemplo 4 es un sub- 
cuerpo de C. 


2. Sea F el cuerpo de los números complejos. ¿Son equivalentes los dos sistemas de €. .- 
ciones lineales siguientes? Si es así, expresar cada ecuación de cada sistema como com- 
binación lineal de las ecuaciones del otro sistema. 


zz, —m2=0 31 + 22 = 0 
211 + z2=0 ti +zx=0 


3. FExamine los siguientes sistemas de ecuaciones como en el Ejercicio 2. 


—I1 + xa + 4x3 = 0 X1 — zz =0 
T1 + 3x2 + 8x3 = 0 ze + 3x3 =0 
¿ut zm+3im=0 


4. FExamine los siguientes sistemas como en el Ejercicio 2. 
2% + (—1 + 2 + m=0 (1+5)0+ 80m — in 14 =0 


3IZ2 — Liz + 5x4 = 0 la, — 112 + 3 + Tra =0 


5. Sea F un conjunto que contiene exactamente dos elementos, O y 1. Se define una adición 
y multiplicación por las tablas: 


+|0 1 O 1 
00 1 0/0 0 
111 0 110 1 


Verificar que el conjunto F, juntamente con estas dos operaciones, es un cuerpo. 


6. Demostrar que si dos sistemas homogéneos de ecuaciones lineales con dos incógni- 
tas tienen las mismas soluciones, son equivalentes. 


7. Demostrar que todo subcuerpo del cuerpo de los números complejos contiene a todo 
número racional. 


8. Demostrar que todo cuerpo de característica cero contiene una copia del cuerpo de 
los números racionales 


6 Algebra lineal 


1.3. Matrices y operaciones 
elementales de fila 


No se puede menos de advertir que en la formación de combinaciones linea- 
les de ecuaciones lineales no hay necesidad de seguir escribiendo las «incógnitas» 


Xi, - --, Xp, ya que realmente solo se opera con los coeficientes A, y los esca- 
lares y;,. El sistema (1-1) se abreviará ahora así: 
AX = Y 
donde ] 
Án ... Áin 
Á mi ... Á mn 
L1 Yi 
X=|: y Y =| : 
Tn Ym 


A se llama matriz de los coeficientes del sistema. Estrictamente hablando. la 
disposición rectangular expuesta no es una matriz, sino una representación 
de una matriz. Una matriz m x n sobre el cuerpo F es una función A del con- 
junto de los pares de enteros (i, j), 1<i<m, 1<j<mnm, en el cuerpo F. 
Los elementos de la matriz 4 son los escalares A(i, j) = A;;, y, con frecuen- 
cia, suele ser más conveniente describir la matriz disponiendo sus elemen- 
tos en un arreglo rectangular con m filas y n columnas, como antes. Así, 
X (anteriormente) es, o define, una matriz n Xx 1, e Y una matriz m x 1. 
Por el momento, AX = Y no es más que una notación abreviada del sistema 
de ecuaciones lineales. Más adelante, cuando se haya definido una multipli- 
cación de matrices, querrá decir que Y es el producto de A y X. 

Deseamos ahora considerar Operaciones sobre las filas: de la matriz A que 
correspondan a la formación de combinaciones lineales de las ecuaciones del 
sistema AX = Y. Se limitará nuestra atención a tres operaciones elementales 
de filas en una matriz m Xx n, sobre el cuerpo F: 


1. Multiplicación de una fila de A por un escalar c no nulo; 

2. Remplazo de la r-ésima fila de A por la fila r más c veces la fila s, don- 
de c es cualquier escalar y r Fs; 

3. Intercambio de dos filas de A. 
Una operación elemental de filas es, pues, un, tipo especial de función (regla) 
e que asocia a cada matriz m x n, A, una matriz m x n, e(A). Se puede des- 
cribir e en forma precisa en los tres casos como sigue: 

l. e(A), = Aj; sí fr, e(4),¡ = CA,;. 

2. e(4);¡= Aj; sí ¡+r, e(4), = Ay; + CAsj. 

3. e(A),, = 4; si ¡es diferente de r y s, e(4),; = As;, e(4), = Ar; 


En la definición de e(4) no es realmente importante cuántas columnas tenga A, 
pero el número de filas de A sí que es decisivo. Por ejemplo, se debe prestar 
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atención a lo que significa intercambiar las filas 5 y 6 de una matriz 5 x 5. Para 
evitar esta clase de complicaciones, convendremos en que una operación ele- 
mental de filas e está definida en la clase de todas las matrices m x n sobre F, 
para algún m fijo, pero para cualquier n. En otras palabras, una e particular 
esta definida en la clase de todas las matrices sobre F' que tienen mm filas. 

Una razón por la que nos limitamos a solo estos tres tipos de operaciones con 
filas, es que efectuada una operación e en una matriz Á. se puede volver a A 
efectuando una operación semejante en e(A). 


Teorema 2. 'A cada operación elemental de filas e corresponde una opera- 
ción elemental de filas e,, del mismo tipo de e, tal que e,(e(A)) = ele,(4) = A 
para todo A. Es decir, existe la operación (función) inversa de una operación 
elemental de filas y es una operación elemental de filas del mismo tipo. 


Demostración. (1) Supóngase que e es la operación que multiplica la r-éstma 
fila de una matriz por un escalar no nulo c. Sea e, la operación que multiplica 
la fila r por c” *. (2) Supóngase que e sea la operación que remplaza la fila r por 
la misma fila r a la que se le sumó la fila s multiplicada por c, r + s. Sea e, la 
operación que remplaza la fila r por la fila r a la que se le ha sumado la fila s 
multiplicada por (—c). (3) S1 e intercambia las filas r y s, sea e, = e. En cada 
uno de estos casos es claro que e,(e(A)) = el(e,(4)) = A para todo A. | 


Definición. Si A y B son dos matrices m x n sobre el cuerpo F, se dice que 
B es equivalente por filas a A si B se obtiene de A por una sucesión finita de opera- 
ciones elementales de filas. 


Usando el Teorema 2, el lector encontrará fácil verificar lo siguiente: Cada 
matriz es equivalente por filas a ella misma; si B es equivalente por filas a A, 
entonces A es equivalente por filas a B; si B es equivalente por filas a A y C es 
equivalente por filas a B, entonces C es equivalente por filas a A. O sea, que 
la equivalencia por filas es una relación de equivalencia (véase Apéndice). 


Teorema 3. Si A y B son matrices equivalentes por filas, los sistemas ho- 
mogeneos de ecuaciones lineales AX = 0 y BX = 0 tienen exactamente las mismas 
soluciones. 


Demostración. Supóngase que se pasa de A a B por una sucesión finita 
de operaciones elementales de filas: 


A = ÁQ > A, >: —>A; = B. 


Basta demostrar que los sistemas 4, =0 y A4;,+¡X = 0 tienen las mismas 
soluciones, es decir, que una operación elemental por filas no altera el conjun- 
to de soluciones. 

Así, supóngase que B se obtiene de A por una sola operación elemental 
de filas. Sin que importe cuál de los tres tipos (1), (2) o (3) de operaciones sea, 
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cada ccuación del sistema BX = 0 será combinación lincal de las ccuaciones 
del sistema AX = 0. Dado que la inversa de una operacion clemental de filas 
es una operación elemental de filas, toda ccuación de AX = 0 será también 
combinación lineal de las ecuaciones de BX = 0. Luego estos dos sistemas 
son equivalentes y, por el Teorema l, tienen las mismas soluciones. |] 


Ejemplo 5. Supóngase que FF es el cuerpo de los números racionales 


2 —1 3 2 
A =|1 4 o —1| 


2 6 —1 9 


Se efectuará una sucesión finita de operaciones elementales de filas en 4, in- 
dicando con números entre paréntesis el tipo de operación realizada. 


2-1 3 2 0-9 3 4 
1 4 0 --1l|9l1 4 o -112 
2 6-1 5 2. 6 -—1 5 
0-9 3 4 0-9 3 4 
1.4 0 -—1|%l1 4 0 -—1]|2, 
0-2 -1 7 0. 1. 131 -3 
0-9 3 4 0 0 4% —£5s5 
1 0-2 13|9l1 0-2 13|2 
0. 1. 1-3 0. 1. 1 -3 
0. 0. 1-4 0. 0 1 -% 
1 0-2 13|9l1 o 0 | 
0. 1 3-41 lo 1 3 
001 -—4 
100 4% 
010 -3 


La equivalencia por filas de A con la última matriz en la sucesión anterior nos 
indica en particular que las soluciones de 


211 — xo + 323 + 2x4 =0 

21 + 42, — xa =0 

231 + 6x2 — ai + 5x4 =0 

y Xg — BA = ( 
Ls + Ex =0 


Zo — ii =0 


son exactamente fas mismas. Queda de manifiesto en el segundo sistema que, 
sI asignamos a x¿ un valor racional c cualquiera, se obtiene una solución 
(- e, he, Ec, e), con lo que toda solución es de esta forma 
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Iiemplo 6. Supóngasc que es F el cuerpo de los números complejos y 


1: 
A=|-i 31 
1 2 


Al efectuar operaciones con filas es conveniente a menudo combinar varias 
operaciones del tipo (2). Teniendo esto presente 


1 0 2+: 0 1 O 1 
-i 31|9%lo0o 34+2|% lo 342190 01. 
1 2 1 2 1 2 1.0 


Con lo que el sistema de ecuaciones 


—ua + 2x2 =0 
—ix1, + 3x2 = 0 
a + 22 =0 


ticne solamente la solución trivial x, = xz = 0. 


En los Ejemplos 5 y 6 obviamente no se estaban haciendo operaciones con 
filas al azar. La elección de las operaciones con filas estaba motivada por el 
deseo de simplificar la matriz coeficiente de una manera análoga a la «elimi- 
nación de incógnitas» en el sistema de ecuaciones lineales. Daremos ahora una 
definición formal del tipo de matriz a la que estábamos tratando de llegar. 


Definición. Una matriz m x n, R, se llama reducida por filas si: 


(a) el primer elemento no nulo de cada fila no nula de R es igual a 1; 
(b) cada columna de R yue tiene el primer elemento no nulo de alguna fila 
tiene todos sus otros elementos UÚ. 


Ejemplo 7. Un ejemplo de matriz reducida por filas es la matriz identidad 
n x n (cuadrada) /. Esta es la matriz n x n definida por 
l, sí ¿i=j 
Li = du = to si it] 
Esta es la primera de las muchas ocasiones en que se usará la delta de 
Kronecker (0). 


En los Ejemplos $5 y 6 las matrices finales obtenidas son matrices reduci- 
das por filas. Dos ejemplos de matrices no reducidas por filas son * 


11.0 0 0 o 2 1 
0 1 -—1 0) 10 —3| 
0 0 1.0 0 0 0 


La segunda matriz no satisface la condición (a), porque el primer elemento 
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no nulo del primer renglón no es 1. La primera matriz sí satislace la condición 
(a), pero no la condición (b) en la columna 3. 

Demostraremos ahora que se puede pasar de cualquier matriz dada a una 
matriz reducida por filas, por medio de un número finito de operaciones ele- 
mentales de fila. Esto, junto con el Teorema 3, proporcionará un instrumento 
efectivo para la resolución de sistemas de ecuaciones lineales. 


Teorema 4. Toda matriz m x n sobre el cuerpo F es equivalente por filas 
a una matriz reducida por filas. 


Demostración. Sea A una matriz m x n sobre F. Si todo elemento de la 
primera fila de A es 0, la condición (a) se cumple en lo que concierne a la fila 1. 
Si la fila 1 tiene un elemento no nulo, sea k el menor entero positivo j para el 
que A,, + 0. Multiplicando la fila 1 por A;,; la condición (a) se cumple con 
respecto a esa fila. Luego, para todo ¡ > 2, se suma (—Aj,) veces la fila 1 a la 
fila í. Y ahora el primer elemento no nulo de la fila 1 está en la columna k, ese 
elemento es 1, y todo otro elemento de la columna k es 0. 

Considérese ahora la matriz que resultó de lo anterior. Si todo elemento 
de la fila 2 es 0, se deja tal cual. Si algún elemento de la fila 2 es diferente de 0, 
se multiplica esa fila por un escalar de modo que el primer elemento no nulo 
sea 1. En el caso de que la fila 1 haya tenido un primer elemento no nulo en la 
columna k, este primer elemento no nulo de la fila 2 no puede estar en la colum- 
na k; supóngase que esté en la columna k, + k. Sumando múltiplos apropta- 
dos de la fila 2 a las otras filas, se puede lograr que todos los elementos de la 
columna k, sean O, excepto el 1 en la fila 2. Lo que tes importante observar es 
lo siguiente: Al efectuar estas operaciones, no se alteran los elementos de la 
fila 1 en las columnas 1, ..., k, ni ningún elemento de la columna k. Es claro 
que, si la fila 1 era idénticamente nula, las operaciones con la fila 2 no afectan 
la fila 1. 

Si se Opera, como se indicó, con una fila cada vez, es evidente que después 
de un número finito de etapas se llegará a una matriz reducida por filas. | 


Ejercicios 
1. Hallar todas las soluciones del sistema de ecuaciones 


(1 — 2x1, — ix =0 
2x1 + (1 — 2)13 = (0. 


3 —1 2 
A =|2 1 1 
tlt—_ 30 


hallar todas las soluciones d2 AX = 0 reduciendo A por filas. 


3. Si 
6 —4 0 
E] 
—1 0 3 
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hallar todas las soluciones de AX = 2X y todas las soluciones de AX = 3X (el símbolo 
cX representa la matriz , cada elemento de la cual es c veces el correspondiente elemen- 
ta de X). 


4. Hallar una matriz reducida por filas que sea equivalente por filas a 


1 (142) 0 
A=|1 2 1 | 
1 2 —1 


5. Demostrar que las siguientes dos matrices no son equivalentes por filas 


2 0 0 1 1 2 
a —1 0)l —2 0 —1]| 
b c 3 1 3 5 


a b 
A = 
h d 
una matriz 2 x 2 con elementos complejos. Supóngase que A es reducida por filas y tam- 
bién que a + b +4 cc +d=0. Demostrar que existen exactamente tres de estas matrices. 


7. Demostrar que el intercambio de dos filas en una matriz puede hacerse por medio 
de un número finito de operaciones elementales con filas de los otros dos tipos. 


8. Considerar el sistema de ecuaciones AX = 0, donde 


a b 
A = 
[ d 
es una matriz 2 x 2 sobre el cuerpo F. Demostrar lo siguiente: 
(a) Si todo elemento de A es 0, entonces cada par (x,, x,) es una solución de AX = 0. 
. (b) Siad — be $ 0, el sistema AX = 0 tiene solamente la solución trivial x, = x, = 0. 
(c) Si ad — be = O y algún elemento de A es diferente de (), entonces existe una solu- 
ción (%, 13) tal que (x,, x2) es una solución si, y solo si, existe un escalar y tal que x, = 
O _ O 
Y X1) Xz = YX2- 


1.4. Matrices escalón reducidas por filas 


Hasta el momento, el operar con sistemas de ecuaciones estaba motivado 
por tratar de encontrar las soluciones de tal sistema. En la Sección 1.3 se esta- 
bleció un método normal de encontrar esas soluciones. Queremos ahora ad- 
quirir alguna información algo más teórica, y para tal propósito es conveniente 
profundizar un poco más en las matrices reducidas por fila. 


Definición. Una matriz m x n, R, se llama matriz escalón reducida por 
fila si: 


(a) R es reducida por filas; 


(b) toda fila de R que tiene todos sus elementos O está debajo de todas las 
filas que tienen elementos no nulos; 
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(c) si las filas |, ..., r son las filas no nulas de R, y si el primer elemento 
no nulo de la fila i está en la columna k;,i= 1,...,r,entocesk, <k, < «+: <k,. 


Se puede describir también una matriz escalón R reducida por filas como 
sigue. Todo elemento de R es 0, o existe un número positivo r, | <r < m, y 
r enteros positivos k,, ..., k, con l<k;<nm y 


(a) R¡¡¿=0 para ¿> r, y R¡¡=0 si j < Kk,. 
(b) Ra, = Oy 1l<i<r,1<j<r. 
(Cc) k, <-++* <Kk,. 


Ejemplo 8. Dos ejemplos de matrices escalón reducidas por filas son la 
matriz identidad n x n y la matriz cero m x n, 0”, cuyos elementos son todos 0. 
El lector no tendrá dificultad en hallar otros ejemplos, pero quisiéramos dar 
otro no trivial: 


01 —3 0 3 
0 0 0 1 2 
0 0 00.50 


Teorema 3. Toda matriz m x n, A, es equivalente por filas a una matriz 
escalón por filas. 


Demostración. Sabemos que A es equivalente por filas a una matriz re- 
ducida por filas. Todo lo que se necesita observar es que, efectuando un nú- 
mero finito de intercambios de filas en una matriz reducida por filas, se la pue- 
de llevar a la forma escalón reducida por filas. | 


En los Ejemplos $5 y 6 se vio la importancia que tienen las matrices redu- 
cidas por filas en la resolución de sistemas homogéneos de ecuaciones lineales. 
Sea ahora examinar brevemente el sistema RX = 0, donde R es una matriz 


escalón reducida por filas. Sean las filas 1, ..., r las no nulas de R, y supóngase 
que el elemento principal no nulo de la fila ¡ está en la columna k;. El sistema 
RX = 0 consta entonces de r ecuaciones no triviales. Además, la incógnita x,, apa- 
recerá (con coeficiente no nulo) solamente en la ¡-ésima ecuación. Si4,,...,un-, 
representan las (n — r) incógnitas que son diferentes de Xk> ---» Xx, enton- 
ces las r ecuaciones no triviales de RX = 0 son de la forma 


Tk + Ss Cu; = 0 

j=1 
(1-3) : : 
Tr, + 3 C,juj = 0. 


j=1 


Todas las soluciones del sistema de ecuaciones RY = O se obtienen dando 
valores arbitrarios a u,, ..., 4,-_,, y calculando entonces los correspondientes 
valores de X;,, ..., Xx. de (1-3). Por ejemplo, si R es la matriz del Ejemplo 8. 
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entonces r= 2, k, =2, A, =4 y las dos ecuaciones no triviales del sistema 
RX = 6 son 
Xo — 33 +Fits=0 O x= 33— 32 
Ta + 225 =0 O i= — 2x5. 


Así, podemos asignar cualquier valor a x,, xz3 y Xs5, digamos x, = a, x3 = b, 
xs = Cc, y obtener la solución (a, 3b — 3c, b, —2c, c). 

Observemos una cosa más, en relación con el sistema de ecuaciones RX = 0. 
Si el número r de filas no nulas de R es menor que n, entonces el sistema RX = 0 
tiene una solución no trivial, esto es, una solución (x,, ..., x,) en que no todo 
x;, €s O. En efecto, como r < n, se puede elegir algún x, que no esté entre las 
r incógnitas X;,, ..., Xx, y se puede entonces construir una solución como 
antes, en que este x;, es l. Esta observación nos lleva a uno de los hechos más 
fundamentales sobre sistemas homogéneos de ecuaciones lineales. 


Teorema 6. Si A es una matriz m x n con m < n, el sistema homogéneo 
de ecuaciones lineules AX = O tiene una solución no trivial. 


Demostración. Sea R una matriz escalón reducida por fila que sea equiva- 
lente por fila a A. Entonces los sistemas AX = 0 y RX = 0 tienen las mismas 
soluciones por el Teorema 3. Si r es el número de filas no nulas de R, entonces 
ciertamente r < m, y como m < n tenemos que r < n. Se sigue inmediatamente 
de las observaciones anteriores que AX = 0 tiene una solución no trivial. | 


Teorema 7. Si A es una matriz n x n (cuadrada), A es equivalente por 
filas a la matriz identidad n x n, si, y solo si, el sistema de ecuaciones AX = 0 
tiene solamente la solución trivial. 


Demostración. Si A es equivalente por filas a /, entonces AX=0e IX=0 
tienen las mismas soluciones. Recíprocamente, supóngase que AX = O tiene 
solamente la solución trivial Y = 0. Sea R una matriz escalón reducida por 
filas n x n, que es equivalente por filas a A, y sea r el número de filas no nulas 
de R. Entonces RX = Ó carece de solución no trivial. Con lo que r > n. Pero 
como R tiene n filas, ciertamente r < n. Con lo que r = n. Como esto quiere 
decir que R tiene un 1 como primer elemento no nulo en cada una de sus n filas 
y como estos 1 están en las diferentes columnas n, R debe ser la matriz identi- 
dad n xn. |] 


Preguntémonos ahora qué operaciones elementales de fila hay que hacer para 
resolver un sistema de ecuaciones lineales AY = Y no homogéneo. De entrada 
cabe observar una diferencia básica con el caso homogéneo; y es que mien- 
tras el sistema homogéneo siempre tiene la solución trivial x, =-+++* =x, =0, 
un sistema no homogéneo no tiene necesariamente solución. 

Se construye la matriz aumentada A' del sistema AX = Y. Esta es la matriz 
m x (n + 1) cuyas primeras n columnas son las columnas de A y cuya última 
columna es Y; más precisamente, 


Ay = Aj, si j<n 
Átln+o = Yi. 
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Supóngase que se efectúa en A una sucesión de operaciones elementales con 
filas, para llegar a una matriz escalón reducida por filas R. Si se efectúa esta 
misma sutesión de operaciones de fila en la matriz aumentada A”, se llegará 
a una matriz 'R' cuyas primeras columnas son las columnas de R y cuya última 
columna tiene ciertos escalares z,, ..., Zm. Los escalares z, son los elementos 
de la matriz m x 1 


que resulta de la aplicación de la sucesión de operaciones de fila a la matriz Y. 
Para el lector es claro que, al igual que en la demostración del Teorema 3, los 
sistemas AX = Y y RX = Z son equivalentes y, como consecuencia, tienen 
las mismas soluciones. Es muy fácil determinar cuándo el sistema RX = Z 
tiene alguna solución y encontrar todas las soluciones si es que existen. En efec- 
to, si R tiene r filas no nulas, con el primer elemento no nulo en la fila ¿ y en 


la columna k,, ¿= 1, ..., r, entonces las primeras + ecuaciones de RX = Z 
expresarán efectivamente las x,,, ..., x,, por las (n — r) restantes x; y los es- 
calares z;,, ..., z,. Las últimas (m — r) ecuaciones son 

0 = £r+1 

O = zm 


y, por tanto, la condición para que €l sistema tenga una solución es z, = 0 
para i > r. Si se cumple esta condición todas las soluciones del sistema se en- 
contrarán, del mismo modo que en el caso homogéneo, dando valores arbi- 
trarios a (n — r) de las x;, calculando luego x,, en la ¡-ésima ecuación. 


Ejemplo 9. Sea F el cuerpo de los números racionales y 


Il —2 1 
A =|2 1 1 
0 9 —l 


Se trata de resolver el sistema AX = Y para ciertos v,, y, e Y3. Efectuando una 
sucesión de operaciones de fila en la matriz aumentada A”, que reduzca por 
filas a A: 


1 —2 l y 1 -2 1 Yi o 
2 1. 1u|92]0 5-1 G2-29]|%, 
0 5 —l. y 0 S —] Y3 
1. -2 1 Y 1-2 1 Y o, 
0. 5-1 (6-2 |Y%|10 1-3 He-2Y |< 
0 0 O (ys — Ya + 241) 0 0 O (ya — Y2 + 2y1) 

1.0 3 su + 2) 

0 1 —$ (Ya — 241) 

0 0 O (Ys — Ya + 2y1) 
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lu condición para que el sistema AX = Y tenga una solución es, pues, 
2N —=Y+y=0 


y u los escalares dados y), satisfacen esta condición, todas las soluciones se ob- 
linen asignando un valor c a x3, y Calculando luego 


a = —$0 + 5(y + 2y2) 
tr = $0 + 5(ya — 2y1). 
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Una observación final respecto al sistema AX = Y. Supóngase que los ele- 
muntos de la matriz A y los escalares y,, ..., y, pertenecen a un subcuerpo 
P, del cuerpo F. Si el sistema de ecuaciones AX —= Y tiene una solución con 
Vir. -., Xx, en F, tiene también una solución con x,, ..., x, en F,. En efecto, 
sobre cualquier cuerpo, la condición para que el sistema tenga una solución 
es que se cumplan ciertas relaciones entre los y,, ..., y, en F, (las relaciones 
, = 0 para ¡> r anteriores). Por ejemplo, sí AX = Y es un sistema de ecua- 
crones lineales, en el cual los escalares y, y A;¡ son números reales, y si existe 


una solución en que x,, .... Xx, son números complejos, entonces existe una 
solución en que los X,, ..., YX, son números reales. 
Ejercicios 


Il. Hallar, mediante reducción por filas de la matriz de coeficientes todas las soluciones 
dle) siguiente sistema de ecuaciones: 


3x1 + 212 -— 6x3 =0 
—Azx y + 5x3 =0 
— 32) + 6xz — 1323 = 0 
— 421 + 212 —_ 2x3 =0 


2. Hallar una matriz escalón reducida por filas que sea equivalente a 


1 — 
A =|2 2 
2 1+2 


¿Cuáles son las soluciones de AX = 0? 


3. Describir explícitamente todas las matrices escalón 2 x 2 reducidas por filas. 


4. Considérese el sistema de ecuaciones 


Tr — za + 223 = 1 
2711 + 2x3 = 1 
T, — 3Z2 + 4x3 = 2, 


¿Tiene este sistema solución? Si es así, determinar todas sus soluciones. 


5. Dar un ejemplo de un sistema de dos ecuaciones lineales con dos incógnitas que no 
tenga solución. 
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6. Mostrar que el sistema 


Ti —= 2Z2+ a+ 2x4 =1 

a+ tm za + Ti =2 

1 + 722 — S%3 — Ta = 3 
no tiene solución. 


7. Hallar todas las soluciones de 


211 — 3XLa — 123 + 5Za + 215 = —2 
zy — 222 — 4x3 + 3 y 252 -—2 
211 — 4d +2 + 2m= 3 
zi, — 5x2 — TX3 + Ola + 2x5 = —7. 


3 —1 2 
A=|2 1 1| 
1 —3 0 


¿Para cuáles ternas (y,, Y, Y3) tiene una solución el sistema AY = Y? 
9. Sea 


8. Sea 


3 —6 2 —1 
0 O 1 1 
l —-2 1 0 


¿Para cuál (y,, Y, Y3, Ya) tiene solución el sistema de ecuaciones AX = Y? 


10. Supóngase que R y R' son matrices escalón 2 x 3 reducidas por filas y que los sis- 
temas RX = 0 y R'X = 0 tienen exactamente las mismas soluciones. Demostrar que R= R”. 


1.5. Multiplicación de matrices 


Es evidente (o debería serlo, en todo caso) que el proceso de formar com- 
binaciones lineales con las filas de una matriz es fundamental. Por esta razón 
es de provecho introducir un esquema sistemático que indique qué operaciones 
se han de realizar; más precisamente, supóngase que B es una matriz n x p 


sobre el cuerpo F, con filas f,, ..., f, y que a partir de B se construye una ma- 
triz C con filas y,, ..., Y, efectuando ciertas combinaciones lineales 
(1-4) Yi = Arbr + As + +++ + Asnbs. 


Las filas de C quedan determinadas por los mn escalares A;;, que son los ele- 
mentos de una matriz m x n, A. Si se desarrolla (1-4) 


(Ca + -Cip) = z AB: :*AirBrp) 
se ve que los elementos de C vienen dados por 


Ci = y A Br. 
r=] 
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Definición. -Sca A una matriz m ox on sobre el cuerpo F y sea B una matriz 
nx p sobre F. El producto AB es la matriz m x p, C, cuyos elementos i, j son 
n 
Ci; = 2, A¡r-B,,. 
r=-1 


Ejemplo 10. He aquí algunos productos de matrices de elementos ra- 
cionales. 


o lo Tr alos illo a a 


Donde 
m=(5 -1 2=1-(56 -1 2+0-(15 4 8) 
em=(0 7 2=-3(5 —1 2+1-(15 4 8) 
0 6 1 1 0 
o) A ES 4 [E >| 
12 62 —3| 5 4113 8 -—2 
3 8 —2 o 1 
Donde 


w=(9 12 -8)=-20 6 D)+3(3 8 -2) 
w=(12 62 —3)= 50 6 1)4+4(3 8 -2) 


o Lo] =Ls 4JLo] 
o 1 Eleas 
Donde 
v=(6 12 =3Q 4) 


(o) p a[73|- 00 


o 1 01f1 -5 2 2.3 4 
(£) o. 0 0][2 sa [00 
| 00 olaaa 0.00 
1 -5 2]P0 1.0 oa 
(E) 2 sa foo o [02 
E —1 000] 0.90 


Es importante observar que el producto de dos matrices puede no estar 
definido; el producto está definido si, y solo si, el número de columnas de la 
primera matriz coimcide con el número de filas de la segunda. Así que no tiene 
sentido intercambiar el orden*de los factores en (a), (b) y (2) de los ejemplos 
anteriores. Frecuentemente se escribirán productos, tales cu:mo AB, sin men- 
cionar explicitamente las dimensiones de los factores, y en tales casos se dará 
por entendido que el producto está definido. Por (d), (e), (£), (g) se ve que, aun- 
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que los productos AB y BA estén definidos, no es necesariamente AB = BA; 
es decir, la multiplicación de matrices no es conmutativa. 


Ejemplo 11. 


(a) Si ] es la matriz identidad m x m y A es una matriz m x n, lA = A. 
(b) Si 7 es la matriz identidad n x n y A es una matriz m x n, Al = A. 
(Cc) Si 0%" es la matriz nula k x m,0*" = 0*%"A. En forma similar, 40”? =0"”, 


Ejemplo 12. Sea A una matriz m x n sobre F. La representación abre- 
viada anterior AX = Y, para sistemas de ecuaciones lineales, es compatible con 
la definición de productos de matrices. Así, si 


X1 

YT 
X=]|*?* 

Tn 


con x, en F, entonces AX es la matriz m x 1 


Ym. 
tal que y, = A;¡X, + AjXa +. + AjnXp- 

El uso de matrices columna sugiere una representación que es frecuente- 
mente útil. Si ó es una matriz n x p, las columnas de B son las matrices n X 1. 
Bi, ..., B,, definidas por 

By, Y 
B, 


La matriz B es la sucesión de estas columnas: 
B = [B,, . . . , By). 


El elemento i, j de la matriz producto AB se forma a partir de la ¡-ésima fila 
de A y de la jf-ésima columna de B. Compruebe el lector que la j-ésima co- 
lumna de AB es AB;: 


AB =[AB,,..., AB,]. 


A pesar de que un producto de matrices depende del orden en que los fac- 
tores están escritos, es independiente del modo en que están asociados, comc 
lo demuestra el siguiente teorema. 


Teorema 8. Si A, B, C son matrices sobre el cuerpo F, tales que los produc- 
tos BC y A(BC) están definidos, entonces también lo están los productos AB, 
(AB)C y 

A(BC) = (ABIC, 
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Demostración, Supóngase que B es una matriz n x p. Como BC está de- 
insda, Ces una matriz con p filas, y BC tiene » filas. Como A(BC) está definida, 
w puede suponer que Á es una matriz m x n. Así el producto AB existe y es 
ana matriz »m x p, de lo que se sigue que el producto (4B)C existe. Para hacer 
ver que 4(BC)= (AB)IC se debe demostrar que 


[4(80)1, = [(AB)C]s; 
pila todos los i, j. Por definición 


[A(BC)],, = E 


= Y 02 A iBra)C a; 
= Y (AB) Co) 


= [(AB)C],;. 


Si Á es una matriz (cuadrada) n x n, el producto 44 está definido. Esta 
matriz se representa por A?. Por el Teorema 8, (44)4 = A(44) o 4?%4 = AA?, 
de modo que el producto AAA está definido sin ambigúedad. Este producto 
sc representa por 4A?. En general, el producto A4 + -: A (k veces) está defini- 
du sin ambigiedad, y se representará por AF. 

()bsérvese que la relación A(BC) = (AB)C implica, entre otras cosas, que 
combinaciones lineales de combinaciones lineales de filas de C son otra vez 
«ombinaciones lineales de filas de C. 

Si B es una matriz y C se obtiene a partir de B por medio de una operación 
clemental de filas, entonces toda fila de C es combinación lineal de las filas de 
HB. y, por tanto, existe una matriz A tal que AB = C. En general, existen muchas 
de estas matrices A, y entre todas ellas es conveniente y posible escoger una que 
lenga algunas propiedades especiales. Antes de ver esto se necesita introducir 
uma clase de matrices. 


Definición. Una matriz m x m se dice matriz elemental si se puede obtener 
de la matriz identidad m x im por medio de una sola operación elemental simple 
de filas. 


Ejemplo 13. Una matriz elemental 2 x 2 es necesariamente una de las 


putentes: 
lor lort LA 
ro) o 1 c 1 
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B 1] cx0, lo eP cx0. 


Teorema 9. Sea e una operación elemental de fila y sea E la matriz ele- 
mental m x m, E = e(1). Entonces, para toda matriz m x n, Á 


e(4A) = EA. 


Demostración. La clave de la demostración radica en que el elemento 
de la ¡-ésima fila y la f-ésima columna de la matriz producto EA se obtiene de 
la ¡-ésima fila de E y de la ¡-ésima columna de A. Los tres tipos de operaciones 
elementales de fila deben ser estudiados separadamente. Se dará una demos- 
tración detallada para una operación del tipo (ii). Los otros dos casos, más 
fáciles de estudiar, se dejan como ejercicios. Supóngase que r £ s y que e es 
una operación que «remplaza la fila r por la fila r más c veces la fila s'». Entonces 


o Óix, LAT 
da = ¡E + 8 i=71. 
Luego 
_ - r o A, 2 Y r 
(EA); y RA Ends, o As; + CA, 1=71. 
Es decir, EA = e(4). 


Corolario. Sean A y B dos matrices m x n sobre el cuerpo F. Entonces 
B es equivalente por filas a A si, y solo si, B = PA, donde P es un producto de 
matrices elementales m x m. 


Demostración. Supóngase que B = PA, donde P = E: :: E,E, y los E, 
son matrices elementales m x m. Entonces E, A es equivalente por filas a A, y 
E,(E,A) es equivalente por filas a E,A. Luego E,E,A es equivalente por filas a 
A, y continuando de este modo se ve.que (E, : :  E,)A es equivalente por filas 
a A. Sean E,, E,, ..., E, matrices elementales correspondientes a cierta su- 
cesión de operaciones elementales de filas que lleva A a B. Entonces B = 
(E, cn” E, JA. i 


Ejercicios : 


3 
a=|; => A ali C=[1 -1. 


Calcular ABC y CAB. 
f1 —1 1 2 — 
A = P 0 1) B=|1 3 |: 
3 O 1 4 4 


Verificar directamente que 4(4B) = A?B. 


1. Sean 


2. Sean 


lonactones limecates Y] 


1 bacontras dos matrices 2 x 2, A. diferentes tales que 42 -- 0, pero 4 $ 0, 


4 Pua cada 4 del Ejercicio 2, hallar matrices elementales £,, E), ..., E, tales que 


10 ... EE A = Í. 


lo —1 
E | B=|_: ¿| 
L 0 


¿Y xiste una matriz C tal que CA = B? 


4 Scan 


tb. Sea A una matriz m x ny Buna matriz n x k. Demostrar que las columnas de € = 4B 
on combinaciones lineales de las columnas de 4. Si %,, ..., q, Son las columnas de A y 
Pro...» Y son las cdlumnas de C, entonces 


Yi = 


Y 


B.¡0tr. 
1 


1 Ma 


7 Scan A y B matrices 2 x 2 tales que AB = I. Demostrar que BA = 1. 


_JCu Ch 
C= E ca | 


mui matriz 2 x 2. Se desea saber si es posible encontrar matrices 2 x 2, A y B, tales que 
'* AB — BA. Demostrar que tales matrices pueden hallarse si, y solo si, C,, + C,,=0. 


N.  Sca 


1.6. Matrices inversibles 


Supóngase que P es una matriz m x m, que es un producto de matrices 
elementales. Para cada matriz m x n, A, la matriz B = PA es equivalente por 
hilas a A; luego A es equivalente por filas a B y existe un producto O de matri- 
ves elementales, tal que A = OB. En particular, esto es verdad cuando A qs la 
matriz identidad m x m. En otras palabras, existe una matriz m x m, OQ, que 
es ella misma un producto de matrices elementales, tal que QP = 1. Como 
veremos, la existencia de una Q con OP = I es equivalente al hecho de que 
IP” es un producto de matrices elementales. 


Definición. Sea A una matriz (cuadrada) n x nm sobre el cuerpo F. Una 
matriz n x n, B, tal que BA = I se llama inversa a la izquierda de A; una matriz 
n xn, B, tal que AB = I se llama inversa a la derecha de A. Si AB = BA = l, 
entonces B se llama inversa bilátera de A, y se dice que A es inversible. 


Lema. Si A tiene una inversa a la izquierda, B, y una inversa a la derecha, 
C, entonces B = C. 


Demostración. Supóngase que BA = TI y que AC = I. Entonces 


B = BI = B(AC) = (BA)JC = IC =C. N 
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Asi, si A €s inversa a la izquierda e inversa a la derecha, A es inversible y 
tiene una inversa bilátera que se representará por A”? y se llamará simplemente 
la inversa de A. 


Teorema 10. Sean A y B dos matrices n x n sobre F. 


(i) Si A es inversible, también lo es A7* y (Ay? = A. 
(ii) Si A y B son inversibles, también lo es AB y (ABY* = B"*A”". 


Demostración. La primera afirmación es evidente por la simetría de la 
definición. La segunda se desprende de las relaciones 


(ABU(B4=D = (BAD(AB) =I1. | 
Corolario. Un producto de matrices inversibles es inversible. 


Teorema 11. Una matriz elemental es inversible. 


Demostración. Sea E una matriz fundamental correspondiente a la ope- 
ración elemental de fila e. Si e, es la operación inversa de e (Teorema 2) y E, = 
e, (1), entonces 


EE, = e(Ex) = ela)) = 1 


E,E = (E) = ele(hD)) = I 
con lo que E es inversible y E, = E”*. | 


Ejemplo -14. 


o io] =lio 
o Lo 13 =Llo 1] 
SS Led Lo 1 


(d) Cuando c 40, 


: AN 2] y E o - 1.0 ] 
O 1 Lo 1 0 cl LO ec! 


Teorema 12. Si A es una matriz n x n, los siguientes enunciados son equi- 
valentes. y 


(1) A es inversible. 
(ii) A es equivalente por filas a la matriz identidad n x n 
(iii) A es un producto de matrices elementales. 


y 
tes 


bionaciones lineales 


Demostración. Sea R una matriz escalón reducida por filas, equivalen- 
le por filas a 4. Por el Teorema 9 (o su corolario), 


R = Es, ... E.,E,A 
dende £,, ..., E, son matrices elementales. Cada E, es inversible, y así 


A =E,!--- ER. 


(omo el producto de matrices inversibles es inversible, se ve que A es inversi- 
ble si, y solo si, R es inversible. Como R es una matriz (cuadrada) escalón re- 
dixida por filas, R es inversible si, y solo s1, toda fila de R contiene un elemento 
1$« nulo, esto es, si, y solo si, R = 7. Hemos visto que A es inversible si, y solo si, 
K =I[ ysiR=lentonces A = E, ',..., E, ?. Se ve ahora que (i), (ii) y (iii) 
son afirmaciones equivalentes respecto de 4. | 


Corolario. Si A es una matriz inversible n x n y si una sucesión de opera- 
v¿nnes elementales de fila reduce A a la identidad, entonces la misma sucesión 
de operaciones, cuando se aplica a I, da A”!. 


Corolario. Sean A y B dos matrices m x n. Entonces B es equivalente por 
hilas a A si, y solo si, B = PA, donde P es una mutriz m x m inversible. 


Teorema 13. Para una matriz n x n, las siguientes afirmaciones son equi- 
rulentes. 


(i) A es inversible. 
(11) El sistema homogéneo AX = 0 tiene solo la solución trivial X = 0. 


(11) El sistema de ecuaciones AX = Y tiene una solución X para cada matriz 
"nx 1, Y. 


Demostración. De acuerdo con el Teorema 7, la condición (11) es equiva- 
lente al hecho de que A es equivalente por filas a la matriz identidad. Por el 
lcorema 12, (1) y (11) son, por tanto, equivalentes. Si A es inversible, la solu- 
ción de AX = Y es X= A ' Y. Recíiprocamente, supóngase que AX = Y 
ticne una solución para cada Y dada. Sea R una matriz reducida por filas que sea 
cquivalente por filas a 4. Se debe demostrar que R = /. Esto equivale a demos- 
trar que la última fila de R no es O (idénticamente). Sea 


0 
0 
0 

1 
St el sistema RX = E puede resolverse para X, la última fila de R no puede 
ser 0. Se sabe que R = PA, donde P es inversible. Luego RX = E si, y solo si, 
4X = P"'*E. De acuerdo con (iii), el último sistema tiene una solución. | 


Corolario. Una matriz cuadrada que tiene una inversa a la izquierda o a 
la derecha es inversible. 
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Demostración. Sea A una matriz m x n. Supóngase que A tiene una 1n- 
versa a la izquierda, es decir, una matriz B tal que BA = /. Entonces AX = 0 
tiene solo la solución trivial, porque Y = IX = B(AX). Luego A es inversible. 
Por otro lado, supóngase que A tiene una inversa a la derecha. es decir. una 
matriz C tal que AC = /. Entonces C tiene una inversa a la izquierda y es, por 
tanto, inversible. Se sigue entonces que A = C”! y así A es inversible con in- 
versa C. | 


Corolario. Sea A = A¡A,'** Ay, donde A,, ..., A, son matrices (cua- 
dradas) n x n. Entonces A es inversible si, y solo si, cada A; €es inversible. 


Demostración. Se ha visto que el producto de dos matrices inversibles 
es inversible. De lo cual es fácil deducir que si cada 4, es inversible entonces 
A es inversible. 

Supóngase ahora que A es inversible. Se demostrará primero que A, e€s 
inversible. Supóngase que X es una matnz n x 1 y que A,X = 0. Entonces 
AX =(4,,...., Ax-1)4,A = 0. Como A es inversible se debe tener que X = 0. 
El sistema de ecuaciones A,¿ XA = 0 no tiene, pues, solución no trivial, y así A, €s 
inversible. Pero ahora 4, *** Ax-1 = AA; * es inversible. Por lo dicho antes, 
Ay.- y €s inversible. Continuando en esta forma se concluye que todo A) es in- 
versible. | 


Quisiéramos hacer ahora un comentario final respecto a la solución de ecua- 
ciones lineales. Supóngase que A es una matriz m x n y que deseamos resolver 
el sistema de ecuaciones AX = Y. Si R es una matriz escalón reducida por filas, 
equivalente por filas a A, entonces R = PA, donde P es una matriz m x m 
inversible. Las soluciones del sistema AX = Y son exactamente las mismas 
que las soluciones del sistema RX = PY(=Z). En la práctica no es mucho 
más difícil hallar la matriz P que reducir por filas A a R. En efecto, supóngase 
que se forma la matriz aumentada A' del sistema AX = Y, con escalares arbi- 
trari0S Y¡, ..., Y, en su última columna. Si entonces se efectúa sobre A” una 
sucesión de operaciones elementales de fila que lleve de 4 a R, se habrá acla- 
rado qué es la matriz P. (El lector deberá remitirse al Ejemplo 9, donde se llevó 
adelante esencialmente este proceso.) En particular si 4 es una matriz cuadrada 
este proceso deja en claro cuándo A es o no inversible, y si 4 es inversible cuál 
es la inversa P. Como ya se ha dado la parte principal de un ejemplo de tal cálcu- 
lo, solo se dará ahora un ejemplo de 2 x 2. 


Ejemplo 15. Supóngase que F es el cuerpo de los números racionales y 


e 

Asi 

hos al a lo 7 12)” 
1 3 ve 2 —1 y O —7 y — 2yo2 


Lo 3 Ya 12 lo O Hye + | 
O 1 +Qy. — Y) O 1 +(Qy — y) 
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de lo que resulta claro que 4 es inversible y 


[+7 
—=+ 7 
Puede parecer engorroso seguir escribiendo los escalares arbitrarios y,, 
Y. ... en el cálculo de las inversas. Algunos encuentran más fácil proceder 
con dos sucesiones de matrices, una que describa la reducción de A a la identi- 
dad, y otra que registre el efecto de la misma sucesión de operaciones partiendo 


de li identidad. El lector juzgará por sí mismo cuál es la forma que le resulta 
mis cómoda para contabilizar los cálculos. 


I.jemplo 16. Hallar la inversa de 


. 
ll 


paljuó Gojima po! pu 
Oui aja pot 


Lo 


A A 


hand 


la 
O to je jalea Coli tojias 
pas 


pra] 
el 
ja at, 
| 
== CO =»O0o 
O | 


O »-==»O Ó-+O0O O 5 Ó 


AA AAA, AAA AA 


OO. O0Om OO ss Cl timo paul 


0 
0 
1 
0 
12 | 
—180 180 


—9 60  —60 
36 192 —180 


A Lo 
¡o) 


Eco] 


30 —180 180 


9  —36 30 
—36 192 —180 |- 
30 —180 180 


nm 
SO O mm 
SD ponia od 
pá 
sr 
y AS EY 
rn =x3—GpPrerona Éí N——— Hp PTA ele lr be 
| i 
O DQO) == ar nin plo coja ia pad CY CO pel 


O O ml 
O ==». O O mn nie 
nl ZO =mOO 


El lector se habrá percatado que se ha hecho un largo estudio sobre las filas 
de una matriz y no se ha dicho casi nada de las columnas. Se ha concentrado 
la atención en las filas por parecer ello más natural desde el punto de vista de 
las ecuaciones lineales. Dado que, obviamente, no hay ningún privilegio con 
respecto a las filas, lo tratado en la última sección pudo haberse hecho usando 
columnas en vez de filas. Si se define una operación elemental de columna y 
. equivalencia por columna, es claro que toda matriz m x n será equivalente 
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por columnas a una matriz «escalón reducida por columnas». Así cada opera- 
ción elemental de columna será de la forma A —> AE, donde E es una matriz 
elemental n x n, y así sucesivamente. 


Ejercicios 


1. Sea 


1 2 1 0 
A =|-—1 0 3 5] 
1-2 1 1 


Hallar una matriz escalón reducida por filas R que sea equivalente a A, y una matriz in- 
versible 3 x 3, P, tal que R = PA. 


2. Repetir el Ejercicio 1, pero con 
2 0 2 
A=|1 —3 —2l 
1 1 1 
3. Para cada una de las dos matrices 
2 5 —1 1 —1 2 
4 —1 2h 3 2 4 
6 4 1 0 1 —2 


emplear operaciones elementales de fila para determinar cuándo es inversible y encon- 
trar la inversa en caso que lo sea. 


4. Sea 
50.0 
AÁ=|1 5 Ol 
015 


¿Para qué X' existe un escalar c tal que AX = cX? 


5. Determinar si 


Ooco0 rm 
SON 
O Y yn 
> qe Án 


-1 


es inversible y hallar 47” si existe. 


6. Supóngase que Á es una matriz 2 x 1 y que B es una matriz 1 x 2. Demostrar que 
C = AB no es inversible. 


7. Sea A una matriz (cuadrada) n x n. Demostrar las siguientes dos afirmaciones: 
(a) Si 4 es inversible y 4B = 0 para alguna matriz n x n, B, entonces B = 0. 
(b) Si 4 no es inversible, entonces existe una matriz n x n, B, tal que AB = 0, 

pero BF 0. 


Fenaciones lncales 2? 


R.  —Sca 


a b 
a=|: dl 


Demostrar, usando operaciones elementales de fila, que 4 es inversible si, y solo si, 
lud — hc) + 0. 


9. Una matriz n x n, A, se llama triangular superior si 4;;= 0 para í > f; esto es, si 
todo elemento por debajo de la diagonal principal es 0. Demostrar que una matriz (cua- 
drada) triangular superior es inversible si, y solo si, cada elemento de su diagonal principal 
es diferente de 0. 


10. Demostrar la siguiente generalización del Ejercicio 6. Si A es una matriz m x n, B 
cs una matriz n x m y n < m, entonces AB no es inversible. 


ll. Sea A una matriz m x n. Hacer ver que por medio de un número finito de operacio- 
nes clementales de fila y/o de columna se puede pasar de A a la matriz R que es simultá- 
neamente «escalón reducida por filas» y «escalón reducida por columnas»; es decir, R;¿=0 
sip Ri=11<i<r, Ri¡=0 sí ¿ > r. Demostrar que R = PAQ, donde P es una 
matriz inversible m x m y Q es una matriz inversible n x n. 


12. El resultado del Ejemplo 16 sugiere que tal vez la matriz 
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cs inversible y 47? tiene elementos enteros. ¿Se puede demostrar esto? 


2. Espacios vectoriales 


2.1. Espacios vectoriales 


En varias partes de la matemática se presentan conjuntos donde tiene sentido 
y resulta interesante considerar las «combinaciones lineales» de los elementos 
de dichos conjuntos. Por ejemplo, en los sistemas de ecuaciones lineales, se 
encontró natural el considerar combinaciones lineales de las filas de una matriz. 
Es probable que el lector ya haya estudiado cálculo y haya tenido que ver con 
combinaciones lineales de funciones; sobre todo si ha estudiado ecuaciones 
diferenciales. Tal vez el lector haya tenido experiencia con vectores en el es- 
pacio euclidiano tridimensional, y en particular con combinaciones lineales 
de tales vectores. 

Hablando en forma simple, el álgebra lineal es aquella rama de la matemáti- 
ca que trata de las propiedades comunes de los sistemas algebraicos, que constan 
de un conjunto más una noción razonable de «combinación lineal» de los ele- 
mentos del conjunto. En esta sección se definirán los objetos matemáticos que 
la experiencia ha mostrado ser las más útiles abstracciones de este tipo de sis- 
temas -algebraicos. 


Definición. Un espacio vectorial (ou espacio lineal) consta de lo siguiente: 


l. un cuerpo F de escalares; 
2. un conjunto V de objetos llamados vectores; 
3. una regla (u operación) llamada adición, que asocia a cada par de vecto- 
res a, B de V un vector a + f de V, que se llama suma de o. y f, de tal modo que: 
(a) la adición es conmutativa, a + PB = B + a; 
(b) la adición es asociativa, a + (fB + y) = la + $) + y; 
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(e) existe un único vector 0 de V, llamado vector nulo, tal que a + 0 = 0, 
para todo a de V; 
(d) para cada vector a. de V, existe un único vector —«a de V, tal que 
» 4 (—a)=0; 
4. una regla (u operación), llamada multiplicación escalar, que asocia a cada 
escalar e de F y cada vector a. de V a un vector ca. en V, llamado producto de c y 
1. de tal modo que: 


(a) la = a para todo a de V; 
(b) (c,c,)a = c,(c,a); 

(c) c(a + $) = cu + cf; 

(d) (c, + c,)a = c,0 + c,0. 


Es importante observar, como la definición establece, que un espacio vec- 
torial es un objeto compuesto que consta de un cuerpo, de un conjunto de «vecto- 
res» y de dos operaciones con ciertas propiedades especiales. El mismo con- 
junto de vectores puede ser parte de distintos espacios vectoriales (véase Ejem- 
plo 5, más adelante). Cuando no hay posibilidad de confusión, se hará refe- 
rencia simplemente al espacio vectorial V, y cuando se desee especificar el cuerpo, 
se dirá que V es un espacio vectorial sobre el cuerpo F. El nombre «vector» se 
da a los elementos del conjunto Y más bien por conveniencia. El origen del 
nombre se encontrará en el Ejemplo 1, pero no se debe dar mucha importancia 
al mombre mismo, ya que la variedad de objetos que pueden ser vectores en V 
puede no parecerse gran cosa a algún concepto de vector que el lector ya tenga. 
Sc tratará de ilustrar esta variedad en una serie de ejercicios que será ampliada 
considerablemente cuando se comience el estudio sistemático de los espacios 
vectoriales. 


Ejemplo 1. El espacio de r-tuples, F”. Sea F cualquier cuerpo y sea V el 
conjunto de todos los n-tuples a = (x,, Xx», . . ., Xx.) de escalares x, de F. Si 
P = (Y1 Yz ---> yn) con y, de F, la suma de a y f se define por 


(2-1) a+ 8 = (11 + Ya, le + Yo, - - - , Tn + Yn)- 

El producto de un escalar c y el vector a se define por 

(2-2) ca = (CX1, CL2, . . - , CLn). 

Que esta adición vectorial y multiplicación escalar cumplen las condiciones 


(3) y (4) es fácil de verificar, usando las propiedades semejantes de la adición 
y multiplicación de los elementos de F. 


Ejemplo 2. El espacio de matrices m x n, F”*". Sea F cualquier cuerpo 
y sean m y n enteros positivos. Sea F"*" el conjunto de todas las matrices 
m x n sobre el cuerpo F. La suma de dos vectores A y B en F”*" se define por 


(2-3) (A +B)is = As + Bas. 


30 Alvcbra lmeal 


El producto de un escalar c y de la matriz A se define por 


(2-4) (cA);; = CAsj. 
Obsérvese que F!**"” = F"”. 


Ejemplo 3. El espacio de funciones de un conjunto en un cuerpo. Sea F cual- 
quier cuerpo y sea S cualquier conjunto no vacío. Sea Y el conjunto de todas 
las funciones de S en F. La suma de dos vectores f y g de V es el vector f + g; 
es decir, la función de S en F definida por 


(2-5) (F + g)(s) = f(s) + g(s). 
El producto del escalar c y la función f es la función cf definida por 
(2-6) (fs) = cf(s). 


Los ejemplos anteriores son un caso particular de este último. En efecto, un 
n-tuple de elementos de F puede considerarse como una función del conjunto 
S de los enteros 1, ..., mn de F. En forma análoga, una matriz m x n sobre el 
cuerpo FF es una función del conjunto S de los pares de enteros (i, /), 1 < i< m, 
l<j<mnm, en el cuerpo F. Para este tercer ejemplo se indica cómo se puede 
verificar que las operaciones definidas satisfacen las condiciones (3) y (4). Para 
la adición vectorial: 


(a) Como la adición en F es conmutativa, 
F(s) + g(s) = gís) + Js) 


para todo s de S, luego las funciones f + g y g + f son idénticas. 
(b) Como la adición en F es asociativa, 


FS) + [g(s) + hs)] = [f(s) + g(s)1 + A(s) 


para todo s, luego f + (g + h) es la misma función que (f + g) + h. 

(c) El único vector nulo es la función cero, que asigna a cada elemento 
de S el escalar 0 de F. 

(d) Para todo f de V, (—f) es la función dada por 


(Ds) = —f(s). 


El lector encontrará fácil verificar que la multiplicación escalar satisface 
las condiciones de (4), razonando como se hizo para la adición vectorial. 


Ejémplo 4. El espacio de las funciones polinomios sobre el cuerpo FF. Sea 
F un cuerpo y sea V el conjunto de todas las funciones f de F en F definidas 
en la forma 


(2-7) Fo =uw+ar+ -.- + car” 


donde Cp, Cy, . - . , €, SOn escalares fijos de F (independiente de x). Una función 
de este tipo se llama función polinomio sobre F. Sean la adición y la multipli- 
cación escalar definidas como en el Ejemplo 3. Se debe observar que si f y g 
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son funciones polinomios y c está en F, entonces f + g y cf son también fun- 
ciones polimomios. 


Ejemplo 5. El cuerpo C de los números complejos puede considerarse 
cumo un espacio vectorial sobre el cuerpo R de los números reales. En forma 
mis general, sea F el cuerpo de los números reales y sea V el conjunto de los 
n-tuples a = (x;, .. ., Xn), donde x,, ..., x, son números complejos. Se define 
la adición vectorial y la multiplicación escalar por (2-1) y (2-2), como en el 
I¡emplo 1. De este modo se obtiene un espacio vectorial sobre el cuerpo R que 
cs muy diferente del espacio C” y del espacio R”. 


Hay unos pocos hechos simples que se desprenden, casi inmediatamente, 
de la definición de espacio vectorial, y procederemos a derivarlos. Si c es un 
escalar y O es el vector nulo, entonces por 3(c) y 4(c) 


c0 = c(0 + 0) = c0 + c0. 
Sumando —(c0) y por 3(d), se obtiene 


(2-8) c0 =0. 
Análogamente, para el escalar O y cualquier vector a se tiene que 
(2-9) 0a = 0. 


Si c es un escalar no nulo y a un vector tal que ca = 0, entonces por (2-8), 
c cx) = 0. Pero 

cHAca) = (ctcja = la = a 
luego, a = O. Así se ve que si c es un escalar y a un vector tal que ca = 0, en- 


tonces c es el escalar cero o a es el vector nulo. 
Si a es cualquier vector de V, entonces 


O = Oa = (1 — Da = la + (— Da = a + (—Da 
de lo que se sigue que 
(2-10) (— Da = —a. 
Finalmente, las propiedades asociativa y conmutativa de la adición vectortal 
implican que la suma de varios vectores es independiente de cómo se combinen 


estos vectores y de cómo se asocien. Por ejemplo, Si %,, %,, %3, 4 SON vectores 
de V, entonces 


loa, + a) + (a + 04) = [os + (a + a)] + au 
y tal suma puede ser escrita, sin confusión, 


01 +0+037+ 04 


Definición. Un vector f$ de V se dice combinación lineal de los vectores 
A1, --, 0, en V, si existen escalares C,, ..., C, de F tales que 


B=00 +--> + 00 = z cia. 
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Otras extensiones de la propiedad asociativa de la adición vectorial y las 
propiedades distributivas 4(c) y 4(d) de la multiplicación escalar se aplican 
a las combinaciones lineales: 


z cias + z día; = S (c; + da; 
i= im ¡=] 


n n 
c Y Ci = 2 (cciJas. 
¡=1 i=1 

Ciertas partes del álgebra lineal están íntimamente relacionadas con la 
geometría. La misma palabra «espacio» sugiere algo geométrico, como lo hace 
el vocablo «vector» para muchos. Cuando se avance en el estudio de los es- 
pacios vectoriales, el lector observará que mucha de la terminología tiene una 
connotación geométrica. Para concluir esta sección introductoria sobre espacios 
vectoriales, se considerará la relación de los espacios vectoriales con la geo- 
metría, hasta un grado que indicará al menos el origen del nombre «espacio 
vectorial». Este será un breve análisis intuitivo. 

Considérese el espacio vectorial R?*. En geometría analítica se identifican 
las ternas (x,, Xx2, x3) de números reales con los puntos del espacio euclidiano 
tridimensional. En tal contexto, un vector se suele definir como un segmento 
dirigido PO, del punto P del espacio a otro punto O. Ello equivale a una formu- 
lación cuidadosa de la idea de «flecha» de P a O. Tal como son usados los vec- 
tores, se ha tenido en mente que queden definidos por su longitud y dirección. 
Así, se deben identificar dos segmentos dirigidos si tienen la misma longitud 
y la misma dirección. 

El segmento dirigido PO, del punto P = (x,, Xx, x3) al punto O = (y,, 
Y2, Y 3), tiene la misma longitud y dirección que el segmento dirigido del origen 
O = (u, 0, 0) al punto (y, — X1, Ya — X2, Y3 — Xx3). Además, este es el único 
segmento que partiendo del origen tiene la misma longitud y dirección que 
PO. Con lo que, si se conviene en operar solo con vectores aplicados al origen, 
hay exactamente un vector asociado con cada longitud y dirección dadas. 

El vector OP, del origen a P = (x,, Xz, x3) está completamente determi- 
nado por P, y es por ello posible identificar este vector con el punto P. En la 
definición del espacio vectorial R”, los vectores se definen simplemente como 
las ternas (x1, X2, X3). 

Dados los puntos P = (x,, X2, X3) y O = (Y 1) Y», Y 3), la definición de suma 
de los vectores OP y OQ puede hacerse geométricamente. Si los vectores no 
son paralelos, entonces los segmentos OP y OQ determinan un plano y estos 
segmentos son dos de los lados de un paralelogramo en aquel plano (véase 
Figura 1). La diagonal de este paralelogramo, que va de O al punto S, define 
la suma de OP y OO como el vector OS. Las coordenadas del punto S son 
(1 + Y) X2 + Y, X3.+ Y3), con lo que esta definición geométrica de la adi- 
ción vectorial es equivalente a la definición algebraica del Ejemplo 1. 

La multiplicación escalar tiene una interpretación geométrica simple. Si 
c es un número real, entonces el producto de c por el vector OP es el vector 
que parte del origen de longitud |c| veces la longitud de OP y dirección que coin- 
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S(X1 + Y 1. X2 + Yo, Xa + ya) 


QU, Y2 y 3) P(X1,Xz, X3) 





FIGURA 1 


cide con la de OP si c > 0, y que es opuesta a la dirección de OP si c < 0. Esta 
multiplicación escalar da justamente el vector OT' donde T = (cx,, Cx,, Cx3), 
y es, por tanto, compatible con la definición algebraica dada en R?. 

De vez en cuando el lector encontrará probablemente provechoso «pensar 
geométricamente» en espacios vectoriales, eso es, trazar gráficos que lo ayuden 
a dustrar y motivar alguna de las ideas. Ciertamente, deberá hacerlo. Sin em- 
bargo, al hacer tales ilustraciones, debe tenerse presente que, por tratar los 
espacios vectoriales como sistemas algebraicos, todas las demostraciones que 
sc hagan deben ser de naturaleza algebraica. 


Ejercicios 
l. Si F'es un cuerpo, verificar que F” (como se definió en el Ejemplo 1) es un espacio vec- 


torial sobre el cuerpo F. 


2. Si V es un espacio vectorial sobre el cuerpo F, verificar que 
(4 + 09) + (03 + 04) = [a + (as + a1)] + 0 


para todos los vectores %,, %,, %, y %¿ de V. 


3. Si C es el cuerpo de los complejos, ¿qué vectores de C? son combinaciones lineales de 
(1, O, —1), (0, l, 1) y (1, l, 1)? 


4. Sea V el conjunto de los pares (x, y) de números reales, y sea F el cuerpo de los nú- 
meros reales. Se define 


(2, Y) + (2 Y) = (24 21, Y + Ya) 
c(z, y) = (cx, y). 


¿Es V, con estas operaciones, un espacio vectorial sobre el cuerpo de los números reales? 
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5. En R" se definen dos operaciones 


aSB=a—B 


cC:a= —Cca. 


Las operaciones del segundo miembro son las usuales. ¿Qué axiomas de espacio vectorial 
se cumplen para (R”, OH, :)? 


6. Sea V el conjunto de todas las funciones que tienen valor complejo sobre el eje real, 
tales que (para todo 1 de R) 


K—0 =/0. 
La barra indica conjugación compleja. Demostrar que V, con las operaciones 


FH+DO = FU + gl) 
(cf)(t) = cftt) 


es un espacio vectorial sobre el cuerpo de los números reales. Dar un ejemplo de una fun- 
ción en Y que no toma valores reales. 


7. Sea V el conjunto de pares (x, y) de números reales y sea F el cuerpo de los números 
reales. Se define 


(x, y) + (Xr, Yi) = (x + L1, 0) 
c(x, y) = (cx, 0). 


¿Es V, con estas operaciones, un espacio vectorial? 


2.2. Subespacios 


En esta sección se introducirán algunos de los conceptos básicos en el es- 
tudio de los espacios vectortales. 


Definición. Sea V un espacio vectorial sobre el cuerpo F. Un subespacio 
de V es un subconjunto W de V que, con las operaciones de adición vectorial y 
multiplicación escalar sobre V, es el mismo un espacio vectorial sobre F. 


Una comprobación directa de los axiomas para un espacio vectorial, de- 
muestra que el subconjunto W de Y es un subespacio si, para todos los a y ff 
de W, el vector a + f está también en W; el vector O está en W; para todo a 
de W, el vector (— a) está en W; para todo a de W y todo escalar c, el vector ca 
está en W. La conmutatividad y asociatividad de la adición vectorial y las pro- 
piedades (4)(a), (b), (c) y (d) de la multiplicación escalar no necesitan ser com- 
probadas, ya que éstas son propiedades de las operaciones en V. Se pueden 
simplificar aún más las cosas. 


Teorema 1. Un subconjunto no vacio W de V es un subespacio de V si, y 
solo si, para todo par de vectores a, $ de W y todo escalar « de F, el vector ca + f 
está en W. 


Demostración. Supóngase que W sea un subconjunto no vacío de V tal 
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yor 11 + fá pertenezca a W para todos los vectores a, f de W y todos los esca- 
nes e de F. Como W no es vacío, existe un vector p en W, y, por tanto, (— 1)p + 
p  Uestá cn W. Ahora bien, si a es cualquier vector de W y e cualquier escalar, 
e) vector ca = ca + O está en W. En particular, (— 1)a = —«u está en W. Final- 
mente, si o y $6 están en W, entonces a + PB = la + $ está en W. Así, W es un 
ubespacio de V, 

Reciprocamente, si W es un subespacio de V, a y f están en W y c es un es- 
volar, ciertamente ca + f está en W. | 


Algunos prefieren usar la propiedad ca + f del Teorema 1 como defini- 
ción de un subespacio, lo que es apenas diferente. Lo importante es que, si W es 
un subconjunto no vacio de V tal que ca + f está en W para todos los a, f de 
MY y todo c de F, entonces W (con las operaciones heredadas de V) sea un es- 
pacio vectorial. Esto da lugar a muchos nuevos ejemplos de espacios vectoriales. 


I:jemplo 6. 

la) Si V es cualquier espacio vectorial, Y es un subespacio de V; el sub- 
conjunto que consta solo del vector nulo es un subespacio vectorial de Y, lla- 
mado subespacio nulo de V*. 

(b) En F”, el conjunto de los n-tuples (x,, ..., x,) con x, = 0 es un sub- 
espacio, pero el conjunto de los n-tvples con x, = 1 + x, no es un subespa- 
cio (n > 2). 

(c) El espacio de las funciones polinomios sobre el cuerpo F es un subes- 
picio del espacio de todas las funciones de F en F. 

id) Una matriz (cuadrada) n x n, sobre el cuerpo Fes simétrica si A,¡= Ay 
para todo í y j. Las matrices simétricas forman un subespacio del espacio de 
his matrices n x n sobre F. 

(e) Una matriz (cuadrada) n x n, A, sobre el cuerpo C de los números 

complejos es hermítica (o autoadjunta) si 


An = As 


para todo j, k, donde la barra indica conjugación compleja. Una matriz 2 x 2 
es hermítica si, y solo si, tiene la forma 


| 2 + 
LIUY, Y 


donde x, y, z y w son números reales. El conjunto de todas las matrices hermi- 
ticas no es un subespacio del espacio de todas las matrices n x n sobre C. En 
electo, si A es hermítica, sus elementos en la diagonal A,,, A22, ..., Son nú- 
meros reales, pero los elementos diagonales de ¿4, en general, no son reales. 
Por otro lado, es fácil ver que el conjunto de las matrices hermíticas n x n €s 
un espacio vectorial sobre el cuerpo de los números reales (con. las operaciones 
usuales). 


* Nota del traductor: Estos subespacios se llaman comúnmente los subespacios triviales de V. 
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Ejemplo 7. El espacio solución de un sistema homogéneo de ecuaciones 
lineales. Sea A una matriz m x n sobre F. Entonces el conjunto de todas las 
matrices (columna) n x 1, X, sobre F tal que AX = 0 es un subespacio del 
espacio de todas las matrices n x 1 sobre F. Para demostrar esto se necesita 
probar que A(cX + Y) = 0 si AX = 0, AY =00 y c un escalar arbitrario de F. 
Esto se desprende inmediatamente del siguiente hecho general. 


Lema. Si A es una matriz m x n sobre F, y B, C son matrices n x p so- 
bre F, entonces 


(2-11) AB + C) = d(AB) + AC 
para todo escalar d de F. 


Demostración. [A(dB + C)lis = Y Au(dB + C)u; 
k 
= 2 (A «Bi; + AnxCus) 
=d z AuBr; + z AnxCr; 


= HAB); + (40); 
= [d(AB) + ACT: | 


En forma semejante se puede ver que (dB + C)A = d(BA) + CA, si la suma 
y el producto de las matrices están definidos. 


Teorema 2. Sea V un espacio vectorial sobre cl cuerpo F. La intersección 
de cualquier colección de subespacios de V es un subespacio de V. 


Demostración. Sea [W,) una colección de subespacios de V, y sea W = 
(a W, su intersección. Recuérdese que W está definido como el conjunto de 
todos los elementos pertenecientes a cada W, (véase Apéndice). Dado que 
todo W, es un subespacio, cada uno contiene el vector nulo. Así que el vector 
nulo está en la intersección W, y W no es vacío. Sean xa y ff vectores de W y sea 
c un escalar. Por definición de W ambos, a y f, pertenecen a cada W,, y por ser 
cada W, un subespacio el vector (ca + ff) está en cada W,. Así (ca + f3) está 
también en W. Por el Teorema 1, W es un subespacio de V. | 


Del Teorema 2 se deduce que si S es cualquier colección de vectores de Y, 
entonces existe un subespacio mínimo de Y que contiene a S; esto es, un sub- 
espacio que contiene a S y que está contenido en cada uno de los otros subespa- 
cios que contienen a $. 


Definición. Sea S un conjunto de vectores de un espacio vectorial V. El sub- 
espacio generado por S se define como intersección W de todos los subespacios 
de V que contienen a S. Cuando S es un conjunto finito de vectores, S = la,, 
Az, - .., A) se dice simplemente que W es el subespacio generado por los vectores 
Ay, Oz... Op. 
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Teorema 3. El subespacio generado por un subconjunto S no vacío de un 
espacio vectorial V es el conjunto de todas las combinaciones lineales de los vec- 
lores de S. 


Demostración. Sea W el subespacio generado por S. Entonces toda com- 
binación lineal 


a = 2101 + 220 + .... + Im0m 


de vectores A,, A, . . ., 0%, de S pertenece evidentemente a W. Así que WM” con- 
hiene cel conjunto L de todas las combinaciones lineales de vectores de S. El 
voujunto £, por otra parte, contiene a S y no es, pues, vacio. Si a, f pertene- 
cen a £, entonces a es una combinación lineal, 


a = x01 + to0m + ---* + ImQm 
de vectores a, de S, y f es una combinación lineal, 


B = Yi Br + Y2B2 + ... + YnBn 


lu vectores f;, en S. Para cada escalar c, 
m n 
ca + B = 2 (cx;Jas + z Y¡B5. 
j= j= 


luego ca + f$ pertenece a £L. Con lo que £ es un subespacio de V. 

Se ha demostrado que £L es un subespacio de Y que contiene a S, y también 
que todo subespacio que contiene a S contiene a L. Se sigue que £ es la inter- 
sección de todos los subespacios qué contienen a S; es decir, que £ es el sub- 
espacio generado por el conjunto S. |] 


Definición. Si S,, S,, ..., S, son subconjuntos de un espacio vectorial V, 
e! conjunto de todas las sumas 
0, +A) +0 +0 


de rectores a; de S; se llama suma de los subconjuntos S,, S,, ..., Sy y se repre- 
nta por 


SS +82 +: +85 


o por 


Si W,, W,, ..., W, son subespacios de V, entonces la suma 
W=W+W+--+W, 
como es fácil ver, es un subespacio de Y que contiene cada uno de los subes- 


pacios W;. De esto se sigue, como en la demostración del Teorema 3, que W 
us el subespacio generado por la unión de W,, W,, .... W.. 
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Ejemplo 8. Sea F un subcuerpo del cuerpo C de los números complejos. 
Supóngase que 


a] = (1, 2, O, 3, 0) 
Ay = (0, O, 1, 4, 0) 
0, = (0,0,0,0, 1). 


Por el Teorema 3, un vector a está en el subespacio W de F”? generado por a,, 
A, A Sl, y Solo si, existen escalares c,, c,, cz €n F, tales que 


a = cj01 -+ CaQ% + C3a. 
Así, W consta de todos los vectores de la forma 
a = (cr, 21, Ca, 3c + 4C», Cs) 


donde c,, c,, cz son escalares arbitrarios de F. En forma alternativa, W puede 
ser escrito como el conjunto de todos los 5-tuples 


oa = (£1, Lo, La, La, Lo) 
con x, en F, tal que 


Ty = 2% 
Ta = 321 + 4x3 


Así (—-3, —6, 1, —S5, 2) está en W, mientras que (2, 4, 6, 7, 8) no. 
Ejemplo 9. Sea F un subcuerpo del cuerpo de los números complejos, 


y sea V el espacio vectorial de todas las matrices 2 x 2 sobre F. Sea W, el sub- 
conjunto de Y que consta de todas las matrices de la forma 


HE 

z 0 

donde x, y, z son escalares arbitrarios de F. Por último, sea W, el subconjunto 
de Y que consta de todas las matrices de la forma 


5, , 
. 0 y 


donde x e y son escalares arbitrarios de F. Entonces W, y W, son subespacios 
de Y. También 


V = W, + W; 


a b a 6 0 0 
h 2) o | o + Lo d] 
El subespacio W, (Y W, consta de todas las matrices de la forma 


> ol 
0 0 


porque 
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Ejemplo 10. Sca A una matriz m x n sobre el cuerpo F. Los vectores fila 
de 4 son los vectores de F” dados por a; = (4;,, -.., Am) i= 1,..., m. El 
subespacio de F” generado por los vectores fila se llama el espacio de filas de A. 
'] subespacio considerado en el Ejemplo 8 es el espacio de filas de la matriz 


12030 
AÁ=|0 0 1 4 Ol 
0000 m1 
Il -. también el espacio de filas de la matriz 
1 2.0 3 0 
B= 0 o 1 4 Ol 
o 0 0 0 O 1 


4 8 1 -8 0 
ljemplo 11. Sea V el espacio de todas las funciones polinomios sobre F. 


Aca S el subconjunto de Y que consta de las funciones polinomios fo, f,, fa, ... 
dulmido por 


Ínlx) = x”, n=0,1,3.... 


Il ntonces Y es el subespacio generado por el conjunto $. 


hjercicios 


l, ¿Cuáles de los siguientes conjuntos de vectores a = (a,, ..., a,) de R” son subespa- 
stos de R” (n > 3)? 


(1) todos los a tal que a, > 0; 

(b) todos los a tal que a, + 3a, = ay; 
(c) todos los a« tal que a, = a,; 

(d) todos los a tal que a,a, = 0; 

(c) todos los a tal que a, es racional. 


2. Sca V el espacio vectorial (real) de todas las funciones f de R en R. ¿Cuál de los si- 
puientes conjuntos de funciones son subespacios de Y? 


(a) todas las f tales que f(x?) = flaY; 

(b) todas las f tales que f(0) = (1); 

(c) todas las f tales que f(3) = 1 + f(—5); 
(d) todas las f tales que f(—1) = 0; 

(e) todas las f que son continuas. 


1. ¿Pertenece el vector (3, —1, 0, —1) al subespacio de R* generado por 10s vectores 
2”, 1, 3, 2), (-1, 1, 1, — 3) y (1, l, 9, — 5)! 


4. Sea W el conjunto de todos los (X,, Xz, X3, Xa, xs) de R? que satisfacen 
221 — a+ 4 2 = ( 
Z1 + 4x3 — 2z=0 
9x1 — 322 + 623 — 324 — 3x5 = 0. 


Ilncontrar un conjunto finito de vectores que genera W. 
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5. Sean F un cuerpo y n un entero positivo (n > 2). Sea V el espacio vectorial de todas 
las matrices n x n sobre F. ¡Cuáles de los siguientes conjuntos de matrices A de Y son 
subespacios de V? 


(a) todas las A inversibles; 

(b) todas las A no inversibles; 

(c) todas las A para las que AB = BA, donde B es cierta matriz dada de V; 

(d) todas las A para las que 4? = A. 

6. (a) Demostrar que los únicos subespacios de R* son R* y el subespacio nulo. 

(b) Demostrar que un subespacio de R? es R? o el subespacio nulo o consta de todos 
los múltiplos escalares de algún vector fijo de R?. (El último tipo de subespacio es, intuiti- 
vamente, una recta por el origen.) 

(c) ¿Puede usted describir los subespacios de R?? 


7. Sean W, y W, subespacios de un espacio vectorial V tal que la unión conjuntista de 
W, y W, sea también un subespacio. Demostrar que uno de los espacios W, está contenido 
en el otro. 


8. Sea Y el espacio vectorial de todas las funciones de R en R; sea V, el subconjunto de 
las funciones pares, f(—x) = f(x); sea V, el subconjunto de las funciones impares, 
Hox) = f(x). 

(a) Demostrar que V, y V¡ son subespacios de Y. 

(b) Demostrar que V, + V,; = V. 

(c) Demostrar que Y, Ny Y, = (0). 


9. Sea W, y W, subespacios de un espacio vectorial Y tales que W, + W, = V y 
W, Mw, = (0). Demostrar que para todo vector a de V existen únicos vectores a, en 
W, y a, en W, tales que a = a, + 0). 


2.3. Bases y dimensión 


Pasamos, ahora, a la tarea de dotar de dimensión a ciertos espacios vec- 
toriales. Aunque usualmente asociamos «dimensión» con algo geométrico, 
debemos encontrar una definición algebraica apropiada para la dimensión de 
un espacio vectorial. Esto se hará mediante el concepto de base de un espacio 
vectorial. 

Definición. Sea V un espacio vectorial sobre F. Un subconjunto S de V se 
dice linealmente dependiente (o simplemente, dependiente) si existen vectores distin- 
[OS A], Az, ..., 0, de S y escalares C,, C,, . . ., C, de F, no todos nulos, tales que 


C1%] + 020%) +“: + Cy0. = 0. 


Un conjunto que no es linealmente dependiente se dice linealmente independiente. 
Si el conjunto S tiene solo un número finito de vectores QA,, Az, ..., A, se dice, 
a veces, que los %,, Az, .. ., a, Son dependientes (o independientes), en vez de decir 
que S es dependiente (o independiente). 


lospuerós vectontales 41 
, 
lus siguientes son fáciles consecuencias de la definición. 


|. Todo conjunto que contiene un conjunto linealmente dependiente es 
htealmente dependiente. 

2. Todo subconjunto de un conjunto linealmente independiente es lineal- 
mente independiente. 

3. Todo conjunto que contiene el vector O es linealmente dependiente; 
vn electo, 1:0= 0. 

4. Un conjunto S de vectores es linealmente independiente si, y solo si, 
todo subconjunto finito de S es linealmente independiente; es decir, si, y solo 
4 para vectores diferentes x,,..., a, de S, arbitrariamente elegidos c,%, + *-- 
tc, 2, = O implica que todo c, = O. 


Definición. Sea V un espacio vectorial. Una base de V es un conjunto de 
tectores linealmente independiente de V que genera el espacio V. El espacio V es 
«h dimensión finita sí tiene una base finita. 


I:jemplo 12. Sea F un subcuerpo de los números complejos. En F? los 
VOCLOTres 


a = ( 3, 0, —3) 
as = (—1, 1, 2) 
as = ( 4, 2, —2) 
a=( 2,1, 1) 


son linealmente dependientes, pues 
201 + 20 — oa +0: as =0. 


los vectores 


€ = (1, O, 0) 
€ = (0, 1, 0) 
es = (0, O, 1) 


son lmealmente independientes. 


Ejemplo 13. Sea F un cuerpo, y en F" sea S el subconjunto que consta 
de los vectores €,, €», ..., €, definidos por 


e =(1,0,0,...,0) 
e = (0,1,0,...,0) 


en =(0,0,0,..., 1). 


SCan Xy, Xz, ..., X, escalares de F, y hágase % = x,0%, + X20% +: + Xx,0,. 
lntonces 
(2-12) Ql = (21, Lo, ..»..,) La). 


l-sto muestra que €,, ..., €, generan F”. Como a=0 si, y solo Si, x, =x2=...= 
Y, = 0, los vectores €,, ..., €, son linealmente independientes. El conjunto 
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S = [€¡,..., €, ) es, por tanto, una base de F”. Esta base particular se llamará 
base canónica de F”. 


Ejemplo 14. Sea P una matriz n x n inversible con elementos en el cuer- 
po F. Entonces P,, ..., P,, las columnas de P, forman una base del espacio 
de las matrices columnas pol 1 Eso se verá como sigue. Si X es una matriz co- 
lumna, entonces 


PX = xP, + «++: + 2.Pn. 


Como PX = 0 tiene solo la solución trivial X =4, se sigue que [P,, ..., P,) 
es un Conjunto linealmente independiente. ¿Por qué generan F”**? Sea Y cual- 
quier matriz columna. Si YX = P”* Y, entonces Y = PX, esto es 


Y =x4P, + +++ +2%pAP1. 
Así, [P,, ..., P,) es una base de F"*?!. 


Ejemplo 15. Sea A una matriz m x n y sea S el espacio solución del sis- 
tema homogéneo AX = 0 (Ejemplo 7). Sea R una matriz escalón reducida 
por filas que es equivalente por filas a A. Entonces S es también el espacio so- 
lución del sistema RX = 0. Si R tiene r filas no nulas, entonces el sistema de 
ecuaciones RX = 0 simplemente expresa r de las incógnitas x;,, ..., x, €n tér- 
minos de las (n — r) incógnitas x, restantes. Supóngase que los elementos prin- 
cipales, no nulos, de las filas no nulas están en las columnas k,, .. ., k,. Sea J el 
conjunto constituido por los n — r índices diferentes de ky, ..., K,: 


J = f11,...,2) —_ [Kr, . . . , kr). 
El sistema RX = 0 tiene la forma 
Tk: + 2 CijTj = 0 


e o 
5 e 
LL 


Ur, + Y Cra; = 0 


donde los c,, son ciertos escalares. Todas las soluciones se obtienen asignando 
(arbitrariamente) valores a aquellos x, con j en J y calculando los correspon- 
dientes valores de xy, . . . ; Xyy- Para cada j de J, sea E, la solución obtenida al 
hacer x;= 1 y x, = 0, para todos los otros ¡ de J. Se afirma que los (n — r) 
vectores E,, con j¡ en J, forman una base para el espacio solución. 

Como la matriz columna E; tiene un 1 en la fila ¡ y ceros en las restantes 
filas, las razones dadas en el Ejemplo 13 permiten concluir que el conjunto 
de estos vectores es linealmente independiente. Por esta razón ese espacio ge- 


nera el espacio solución. Si la matriz columna 7, con elementos f,,..., f,, per- 
tenece al espacio solución, la matriz 
N = 2) tE, 
J 


pertenece también al espacio solución, y es una solución tal que x; = f; para 
cada j¡ de J. La solución con esta propiedad es única; luego N = T y T perte- 
nece al espacio generado por los vectores E). 
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l:yemplo 16. Daremos ahora un ejemplo de una base infinita. Sea F un 
subuuerpo de los números complejos y sea V el espacio de las funciones poli- 
nos sobre F. Se recuerda que estas funciones son las de F en F que tienen 
la forma 


fx) =0 + ar+ -.: +Caz”. 


Sra fa) = 4, k =0, 1,2,... El conjunto (infinito) (fo, fi, f, . - | es una base 
de J, Es claro que el conjunto genera V, pues la función f anterior es 


f = Cofo + Ccf+ cc: + Crfn. 


Il lector verá que esto es virtualmente una repetición de la definición de la fun- 
vión polinomio, es decir, una función de F en F es una función polinomio si, 
y solo si, existe un entero n y escalares co, ..., €, tales que f = Cofo +: + 
tal, ¿Por qué son estas funciones independientes? Demostrar que el conjunto 
[tn fi, £. ...j es independiente, es lo mismo que demostrar que todo sub- 
conjunto finito suyo es independiente. Bastará entonces demostrar que, para 
lindo », el conjunto (fo, ..., f,j es independiente. Supóngase que 


Cofo + ... + Crfn = 0. 
l to dice que 
Co + 01 + -** + Cat" =0 


para todo x de F; en otras palabras, cada x de F es raiz del polinomio f(x) = 
tn +C,x +=“: + C,x”. Se supone que el lector sabe que un polinomio de grado n 
von coeficientes complejos puede tener a lo sumo n raices distintas. Se sigue 
que, Co ===, =0. 

Se ha visto una base infinita de V. ¿Quiere decir esto que Y no es de dimen- 
son finita? En realidad, es así, pero ello no se deduce de la definición, porque 
«de todo lo que se sabe Y podría tener también una base finita. Esa posibilidad 
queda fácilmente descartada. (Se eliminará en general en el siguiente teorema.) 
Supóngase que tenemos un número finito de funciones polinomios g,, ..., g,. 
Hibrá una mayor potencia de x que aparece (con coeficiente no nulo) en g, (x), ...., 
e, (x). Si tal potencia es k, es claro que f.,¡(x)= 4*! no pertenece al subes- 
pacio generado por los g,, ..., g,- Así, pues, Y no es de dimensión finita. 


Un comentario final respecto a este ejemplo. Una base infinita no tiene 
nada que ver con «combinaciones lineales infinitas». El lector que sienta el 
deseo irresistible de introducir series de potencias 


o 
YD Cixr* 
k=0 
en este ejemplo, debe estudiarlo cuidadosamente de nuevo. Si con ello no se 
le aclara todavía, debe limitar su atención, de ahora en adelante, a espacios 
de dimensión finita. 


Teorema 4. Sea V un espacio vectorial generado por un conjunto finito de 
vectores fi, PB», ..., Bm. Entonces todo conjunto independiente de vectores de 
V es finito y no contiene más de m elementos. 
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Demostración. Para demostrar este teorema es suficiente ver que todo 
subconjunto S de V que contiene más de m vectores es linealmente dependiente. 
Sea S un tal conjunto. En S hay vectores diferentes X,, %,, . . . , %,, donde n > m. 
Como f;, ..., 6, generan V, existen escalares A,; en F tales que 


m 
aj = 2 AsBi. 
(«=1 
Para cualesquiera n escalares X;, Xz, ..., Xp, se tiene 


rn 
TO +++: +20 = Y 20; 
Jul 


2 2; >> A Bs 
jul 11 


y y (Aya)Bs 


gal j=1 


y ( z Á 523)86 


fu] MNgoan 


Como n > m, el Teorema 6 del Capítulo 1 implica que existen escalares x,, 
X2, ===.» Xp, no todos 0, tales que 


rn 

Y A.zxj= 0, 1<:2<m. 

j=l 
Luego x,%, + X3%, + ::* + Xx,0, = U. Ello demuestra que S es un conjunto 
linealmente dependiente. | 


Corolario 1. Si V es un espacio vectorial de dimensión finita, entonces dos 
bases cualesquiera de V tienen el mismo número (finito) de elementos. 


Demostración. Como V es de dimensión finita, tiene una base finita 
(Br, Ba, ...) Bm) - 


Por el Teorema 4, toda base de V es finita y contiene no más de m elementos. 
Así, si [%;, %z, . . ., 4, es una base, n < m. Por el mismo razonamiento, m < n. 
Luego m = n. 


Este corolario permite definir la dimensión de un espacio vectorial de di- 
mensión finita como el número de elementos de una base cualquiera de V. Se 
indicará la dimensión de un espacio Y de dimensión finita por dim V. Ello nos 
permite volver a enunciar el Teorema 4 como sigue. 


Corolario 2. Seu V un espacio vectorial de dimensión finita y sea n = dim V. 
Entonces 


(a) cualquier subconjunto de V que contenga más de n vectores es linealmente 
dependiente; 
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(db) nineún subconjunto de V que contenga menos de n vectores puede ge- 
nerar 1. 


Ijemplo 17. Si F es un cuerpo, la dimensión de F” es n, porque la base 
canónica de F” contiene n vectores. El espacio de las matrices F"*" tiene di- 
muensión mn. Ello es claro por analogía con el caso de F”, ya que las mn matri- 
ces que tienen un 1 en el lugar í, j, con ceros en los demás, forman una base de 
[""*" Si A es una matriz m x n, entonces el espacio solución de A tiene dimen- 
won 1 — r, donde r es el número de filas no nulas de una matriz escalón reducida 
por Flas, que es equivalente por filas a A. Véase el Ejemplo 15. 

Si V es cualquier espacio vectorial sobre F, el subespacio nulo de V es ge- 
nerado por el vector 0, pero (0) es un conjunto linealmente dependiente y no 
uni base. Por esta razón se conviene que el subespacio nulo tenga dimensión 0. 
Se podría llegar también a la misma conclusión pensando que el conjunto vacío 
es una base del subespacio nulo. El conjunto vacío genera (0;, pues la intersec- 
ción de todos los subespacios que contiene el conjunto vacío es (0), y el conjunto 
vacio es linealmente independiente, porque no contiene vectores. 


Lema. Sea S un subconjunto linealmente independiente de un espacio vecto- 
ntul V, Supóngase que fB es un vector de V que no pertenece al subespacio generado 
por S. Entonces el conjunto que se obtiene agregando ff a S, es linealmente inde- 
pendiente. 


Demostración. Supóngase que d;, ..., A, son vectores distintos de S y que 
Ci04 + -*- + nm +08 =0. 


Entonces b = 0; de otra manera, 


y [ff está en el subespacio generado por $. Así, c,%, + *** + C,yA,, = 0, y como 
Ss es un conjunto linealmente independiente, todo c, = 0. |] 


Teorema 5. Si W es un subespacio de un espacio vectorial de dimensión 
fmita V, todo subconjunto linealmente independiente de W es finito y es parte 
de una base (finita) de W. 


Demostración. Supóngase que $, es un conjunto linealmente independiente 
de W. Si S es un subconjunto linealmente independiente de W que contiene 
a Sy, entonces S es también un subconjunto linealmente independiente de Y; 
como Y es de dimensión finita, S no tiene más de dim V elementos. 

Se extiende S, a una base de W, como sigue. Si S¿ genera W, entonces S, 
es una base de W y está demostrado. Si $, no genera W, por el lema anterior 
se halla un vector ff, en W tal que el conjunto S, = So U [f,] es independiente. . 
Si S, genera W, está demostrado. Si no, se aplica el lema para obtener un vector $, 
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en W tal que S, = $, U [fB,) es independiente. Si se continúa de este modo, 
entonces (y en no más de dim y de etapas) se llega a un conjunto 


Sm = So U [Br - - - , Bm) 
que es una base de W. | 


Corolario 1. Si W es un subespacio propio de un espacio vectorial de di- 
mensión finita V, entonces W es de dimensión finita y dim W < dim V. 


Demostración. Podemos suponer que W contiene un vector a + 0. Por 
el Teorema 5 y su demostración existe una base de W que, conteniendo a a, 
no contiene más que dim V elementos. Luego W es de dimensión finita y 
dim W < dim V. Como es un subespacio propio existe un vector f$f en V que 
no está en W. Agregando f a cualquier base de W se obtiene un subconjunto 
linealmente independiente de V. Así, dim W < dim V. | 


Corolario 2. En un espacio vectorial V de dimensión finita todo conjunto 
linealmente independiente de vectores es parte de una base. 


Corolario 3. Sea A una matriz n x n sobre el cuerpo F, y supóngase que 
los vectores fila de A forman un conjunto linealmente independiente de vectores 
de F". Entonces Á es inversible. 


Demostración. Sean %,, Az, ..., 4, vectores fila de 4, y supóngase que W es 
un subespacio de F” generado por %,, A», ..- , %,. Como los y, %,, . . ., %, SON 
linealmente independientes, la dimensión de W es n. Por el Corolario 1 se tiene 
que W = F”. Luego existen escalares B,, en F' tales que 


n 
e= 2 B;¿Q5, 1<1i<m 
Ju 
donde (€,, €7, ..., €,) €s la base canónica de F”. Así, para la matriz B de ele- 
mentos B,, se tiene 


BA =1. | 


Teorema 6. Si W, y W, son subespacios de dimensión finita de un espacio 
vectorial, entonces W, + W, es de dimensión finita y 


dim W, + dim W, = dim (W, MN W,) + dim (W + W,). 


Demostración. Por el Teorema 5 y sus corolarios, W, (1 W, tiene una 


base finita fa;, ..., 0%,) que es parte de la base 

1%1, e. Op, Bi, > Bn para W, 
y parte de la base 

[01 O Yi ---> Yn) para W,. 


El subespacio W, + W, es generado por los vectores 


Ol) +» +» - y Kk) Br - - - , Bm, Y - - «5 Yn 
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y estos vectores forman un conjunto independiente. En etecto, supóngase que 
YD 1,0; + 2 yB, + E 2,Yr = 0. 
lntonces 
— 2 Y, = 2 2,0; + 2 ysb; 
«¡e muestra que Y z,y, pertenece a W,. Como 2 z,y, también pertenece a W,, 
w gue que 
Z 2,17 = 2 C0 
pura ciertos escalares C,, ..., Ci. Como el conjunto 
lar, . . - , Ax, Vd) + - +3 Ynj 
ex independiente, cada uno de los escalares z, = 0. Así, 
2 xa; + 2 y5B, = O 
y como 
lor, -..,0%, Br --- , Bm) 
es también un conjunto independiente, cada x, = 0 y cada y, = 0. Así, 
lor, ...,0%, Br ---» Bm Yip- >» + > Ynj 
es una base para W, + W,. Finalmente, 


dim W, + dim W; = (k + m) + (k + n) 
=k+(m+k>+m0m 


Cerremos esta sección con una observación referente a la independencia 
y dependencia lineal. Se han definido estos conceptos para conjuntos de vec- 
tores. Es útil haberlos definido para sucesiones finitas (n-tuples ordenados) 


de vectores: %;,, ..., q,. Se dirá que los vectores %,, ..., 0%, son linealmente 
dependientes si existen escalares fijos C,, ..., C,, no todos nulos, tales que 
(¡%, +: +C,0%, = 0. Todo esto es tan natural que el lector podría creer 


que se ha usado ya esta terminología. ¿Cuál es la diferencia entre una suce- 
sión finita %,, ..., 0, y el conjunto [a,, ..., %,)? Hay dos diferencias: identidad 
y orden. 

Si se examina el conjunto (a,, ..., 0%,j es corriente suponer que no hay 
dos vectores 1, ..., A, que sean idénticos. En una sucesión ay, ..-, Y, todos 
los a, pueden ser el mismo vector. Si q, = a;, para algún i + j, entonces la su- 
cesión A, ..., A, €S linealmente dependiente: 


A; + (— Ia, = (, 


Así, Si A,, ..., Y, SON linealmente independientes, todos son distintos, y se pue- 
de hablar del conjunto fa,, ..., a,) sabiendo que tiene n vectores. Así, evi- 
dentemente, ninguna confusión surgirá en el estudio de bases y dimensión. 
La dimensión de un espacio Y de dimensión finita es el mayor n, tal gue un 
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n-tuple de vectores de Y es linealmente independiente, y así sucesivamente. 
El lector que crea que este párrafo no es más que palabras, puede preguntarse 
si los vectores 


a) = (er??, 1) 


om = (V110, 1) 


son linealmente independientes en R?. 

Los elementos de una sucesión están enumerados en un orden determina- 
do. Un conjunto es una colección de objetos con una disposición no determi- 
nada u ordenada. Claro que al describir el conjunto se deben indicar sus ele- 
mentos, y ello requiere elegir un orden. Pero el orden no es parte del conjunto. 
Los conjuntos (1, 2, 3, 4) y (4, 3, 2, 1) son idénticos, mientras que 1, 2, 3, 4 es 
una sucesión muy diferente de 4, 3, 2, 1. El aspecto ordinal de las sucesiones 
no entra en juego en los asuntos de independencia, dependencia, etc., porque 
la dependencia (como se definió) no está afectada por el orden. La sucesión 
On, - --, %, es dependiente si, y solo si, la sucesión a,, .. ., a, es dependiente. 
En la sección siguiente, el orden será importante. 


Ejercicios 
l. Demostrar que si dos vectores son linealmente dependientes, uno de ellos es un múlti- 
plo escalar del otro. 
2. ¿Son los vectores 
a = (1, 1, 2, 4), a = (2, —1, —5, 2) 
03 = (1, —1, —4, 0), a = (2, l, 1, 6) 
linealmente independientes en R*? 


3. Hallar una base para el subespacio de R* generado por los cuatro vectores del Ejer- 
CICIO 2. 


4. Demostrar que los vectores 
a; = (1,0, —1D), as = (1, 2, 1), as = (0, —3, 2) 


forman una base para R?*. Expresar cada uno de los vectores de la base canónica como 
combinación lineal de a;,, a, y a. 


5. Hallar tres vectores de R* que sean linealmente dependientes y tales que dos cuales- 
quiera de ellos sean linealmente independientes. 


o 
6. Sea V el espacio vectorial de todas las matrices 2 x 2 sobre el cuerpo F. Demostrar 
que V tiene dimensión 4, encontrando una base de V que tenga cuatro elementos. 


7. Sea V el espacio vectorial del Ejercicio 6. Sea W, el conjunto de las matrices de la 


Y Zz 
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yo wea DY, el conjunto de las matrices de la forma 


a b] 
=a Cc 
(la) Demostrar que W, y W, son subespacios de V. 
(bh) Hallar la dimensión de W,, W,, W, + W, y W,NW,. 


K  Nucvamente, sea V el espacio de las matrices 2 x 2 sobre F. Hallar una base (4,, A), 
I,, 1,4; de V, de modo que 45 = A), para cada j¡. 


%. Sca V un espacio vectorial sobre el cuerpo F' de los números complejos. Supóngase 
ue x, f3 y y sean vectores linealmente independientes en V. Demostrar que (a + f). (f + y) 
y ly + 2) son linealmente independientes. 


MW. Sca V un espacio vectorial sobre el cuerpo F. Supóngase que hay un número finito 
¿e vectores %,, ..., a, en Y que generan V. Demostrar que V es de dimensión finita. 


Íl. Sea V el conjunto de todas las matrices 2 x 2, A, con elementos complejos que sa- 
listacen 4, + A), =0. 

(1) Hacer ver que V es un espacio vectorial sobre el cuerpo de los números reales, con 
Las operaciones comunes de adición de matrices y multiplicación de matrices por un escalar. 

(b) Hallar una base de este espacio vectorial. 

(u) Sea W el conjunto de todas las matrices 4 de V tales que 47, = — 4, (la barra 
medica complejo conjugado). Demostrar que W es un subespacio de V y hallar una base de W. 


12. Demostrar que el espacio de todas las matrices m x n sobre el cuerpo F tiene dimen- 
sion ,1n, presentando una base para este espacio. 


13. Analizar el Ejercicio 9, cuando V es un espacio vectorial sobre el cuerpo de dos ele- 
mentos, descrito en el Ejercicio 5, Sección 1.1. 


14. Sea V el conjunto de los números reales. Considerar Y como un espacio vectorial 
sobre el cuerpo de los números racionales. con las operaciones usuales. Demostrar que este 
espacio vectorial no es de dimensión finita. 


2.4. Coordenadas 


Una de las características útiles de una base 63 en un espacio Y de dimensión 
n es que permite esencialmente introducir coordenadas en Y en forma análo- 
piu a las «coordenadas naturales», x;,, de un vector a = (x,, ..., x,) en el es- 
pacio F”, En este esquema, las coordenadas de un vector a en V, respecto de 
la base (6, serán los escalares que sirven para expresar a como combinación 
lineal de los vectores de la base. Así, pues, sería de considerar las coordenadas 
naturales de un vector a en F” como definidas por a y la base canónica de F”; 
sin embargo, al adoptar este punto de vista se debe tener mucho cuidado. Si 


a=(4....,Tn) = 2 L:6; 


y GB es la base canónica de F”", ¿cómo quedan determinadas las coordenadas 
de a por (HB y a? Una manera de formular la respuesta es la siguiente. Un vector 
dado, a, tiene una expresión única como combinación lineal de los vectores 
de la base canónica, y la coordenada ¡-ésima x, de a es el coeficiente de e, en 
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esta expresión. Desde este punto de vista, se puede decir cuál es la ¡-ésima coor- 
denada, porque se tiene un orden «natural» de los vectores de la base canónica, 
esto es, se tiene una regla para determinar cuál es el «primer» vector en la base, 
cuál es el «segundo» vector, y así sucesivamente. Si (3 es una base arbitraria 
del espacio Y de dimensión n. no se tendrá probablemente. un orden natural 
de los vectores de (%, y, por tanto, será necesario imponer algún orden a estos 
vectores antes que se pueda definir la «i-ésima coordenada de a respecto a (B». 
Para plantearlo de otra forma, se definirán las coordenadas respecto a una 
sucesión de vectores y no de un conjunto de vectores. 


Definición. si V es un espacio vectorial de dimensión finita, una base or- 
denada de V es una sucesión finita de vectores linealmente independiente y que 
genera V. 


Si la sucesión A,, ..., 4%, es una base ordenada de V, entonces el conjunto 
[%, -.., 0, es una base de V. La base ordenada es el conjunto, juntamente 
con el orden dado. Se incurrirá en un pequeño abuso de notación y se escribirá 


GB = fos, . . . , On) 


diciendo que (3 es una base ordenada de Y. 
Ahora supóngase que V es un espacio vectorial de dimensión finita sobre 
el cuerpo F' y que 


G = [0t1, - - - , Anf- 


es una base ordenada de V. Dado a de V, existe un único n-tuple (x;, ..., Xn) 
de escalares tal que 


n 
a= ? TA. 


$. ] 


Este n-tuple es único, ya que si también se tiene 


n 
a= 2 20; 
¿=] 


entonces 
n 
Y (zx, — za; =0 
j=1 


y la independencia lineal de los a, asegura que x; — z; = 0, para todo i. Se lla- 
mará a x; la i-ésima coordenada de o respecto a la base ordenada 


G = laz, . . - , An) 
Si 
B = 2 Yi0; 
entonces . 
a+ Bf = 2 (1; + y:)as 
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de modo que la ¿-ésima coordenada de (a + f3) en esta base ordenada es (x;+ y;). 
ln forma análoga, la ¡-ésima coordenada de (ca) es cx;. Debe observarse tam- 
Inen que, cada n-tuple (x,, ..., x,) de F” es el n-tuple de coordenadas de algún 
vector de V, a saber, el vector 


2 T ¿Oo 


5 en ] 
Resumiendo, cada base ordenada de Y determina una correspondencia 
biuinivoca 


a— (Li, ... , a) 


entre el conjunto de todos los vectores de V y el conjunto de todos los n-tuples 
lu f". Esta correspondencia tiene la propiedad de que el correspondiente de 
(+ + ff) es la suma en F” de los correspondientes de a y $, y el correspondiente 
de (ca) es el producto en F” del escalar c y el correspondiente de «. 

Cabría preguntarse, en este momento, ¿por qué no se elige simplemente 
alguna base ordenada de V y se expresa todo Y por su correspondiente n-tuple 
«le coordenadas, ya que así se tiene la conveniencia de operar solo con n-tuples? 
lato iría contra nuestro propósito por dos razones. Primera, como la defini- 
von axiomática de espacios vectoriales indica, se trata de aprender a razonar 
con espacios vectoriales como sistemas algebraicos abstractos. Segunda, in- 
«huso en aquellos casos en que se usan coordenadas, los resultados más impor- 
tintes se obtienen de la capacidad que se tenga de cambiar sistemas de coor- 
denadas, es decir, de cambiar la base ordenada. 

A menudo, será de mayor conveniencia usar la matriz de las coordenadas 
de xy respecto a la base ordenada (3: 


Xi 
X=|: 
Tn 


en vez del n-tuple (x,, ..., x,) de coordenadas. Para indicar la dependencia 
« esta matriz de coordenadas respecto de la base se usará el símbolo 


[ala 
para la matriz de coordenadas del vector a respecto a la base ordenada (3. Esta 
notación será particularmente útil cuando procedamos ahora a describir qué 
le sucede a las coordenadas de un vector « cuando se cambia de una base orde- 
nuda a otra. 
Supóngase, entonces, que Y es de dimensión n y que 


GB = fa,,...,Qn) y B' = [al,..., 0) 


wan dos bases ordenadas de V. Existen escalares únicos P,, tales que 


(2-13) ay = Y» P,jas, 1<j<nm. 
¡=1 
Sean Xy, . . ., Xx; las coordenadas de un vector dado a en la base ordenada G'. 


lntonces 


52 Aleebra lincal 


a = x3301 + -->+ + 250 
n 
= Y 2130) 
j=1 
n 
= 2 z z P.a; 


j=1 $. .] 


y z (Paya; 


jul is 


y (2 P 52) Qs. 
jul 


$=1 


Se tiene así la relación 


(2-14) a = y 2 Psj2)) Q 


f=1 


Como las coordenadas x,, X», ..., X, de a en la base ordenada GB están uni- 
vocamente determinadas, se sigue de (2-14) que 


(2-15) z= E Py 1<iS<nm 
jel 


Sea P la matriz n x n cuyo i, j elemento es el escalar P,, y sean X y X” las ma- 
trices de coordenadas del vector a en las bases ordenadas GB y GB”. Entonces se 
puede escribir (2-15) como 

(2-16) *X=PX. 


Como GB y (3 son conjuntos linealmente independientes, X = 0, si, y solo si, 
X' = 0, Así, de (2-16) y del Teorema 7 del Capítulo 1, se sigue que P es inver- 
sible. Luego 

(2-17) Xx” = PAX. 


Si se usa la notación introducida anteriormente para la matriz de coordenadas 
de un vector respecto a una base ordenada, entonces (2-16) y (2-17) dicen que 


[ala = Plalor 
[ala = P[a]a. 
Con lo que lo anterior puede resumirse asi. 
Teorema 7. Sea V un espacio vectorial de dimensión n sobre el cuerpo F, 


y sean BR y 63 bases ordenadas de V. Entonces existe una única matriz n x n, 
necesariamente inversible, con elementos de F, de modo que 


(i) [a] = Pla] 
(11) [ola =P E 


para todo vector a de V. Las columnas de P están dadas por 


P;¡= [0;]g, j=1l,..., hn. 
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Para completar el análisis anterior, sec demostrará también el siguiente 
ivorcmia. 


Veorema 8. Supóngase que P es una matriz inversible n x n sobre F. Sea 
l um espacio vectorial de dimensión n sobre F, y sea B una base ordenada de V. 
lntonces existe una base ordenada GB', única, de V tal que 


(i) [a]g = Plala; 
(ii) [0] = P *[2]g 
pura todo vector a en V. 
Demostración. Sea (B, que consta de los vectores %,, ..., 0d,. Si 6 = 
[mi, ..., 0,) es una base ordenada de V, para la cual se tiene (i), es claro que 


n 
, 
o = z P.¡as. 
q. 


Au, solo se necesita demostrar que los vectores a;, definidos por estas igual- 
diles, forman una base. Sea Q = P”*. Entonces 


z Quaj = z Qu z P;ja; 
= 2 z P ¡Qu A; 
=> z (2 Pi Qs) A; 
= QUk. 
(vn lo que el subespacio generado por el conjunto 
B' = laj,..., an) 
contiene a (6H y, por tanto, es igual a V. Así que (G3' es una base, y por su defini- 
con y por el Teorema 7 es claro que (1) es válido y también lo es (11). | 
Ejemplo 18. Sea F un cuerpo y sea 
a = (%1, Ze, . .., Tn) 
un vector de F”. Si GB es la base ordenada canónica de F”, 
BR = fe, ..., En) 
la matriz de coordenadas del vector « en la base (B está dada por 
L1 
laJa = % 
La 
Ejemplo 19. Sea R el cuerpo de los números reales y sea O un número real 
dado. La matriz 
_[cosó —sen o! 
sen 0 cos 0 
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a =x101 + --- + 250 


n 
2 230% 
jul 


2 23 s P;j¡0; 


j=1l ¿u] 


$ z (P; ¡¡2j) as 


J=1 f=1 


Y (2 Ps) As. 
$] Mjel 


Se tiene así la relación 


(2-14) a = S z Pojz)) Q 


$1 


Como las coordenadas x,, X», ..., X, de q en la base ordenada (B están uní- 
vocamente determinadas, se sigue de (2-14) que 


(2-15) a=Y3PA  1<i<nm 
jul 


Sea P la matriz n x n cuyo i, j elemento es el escalar P,, y sean X y X” las ma- 
trices de coordenadas del vector a en las bases ordenadas (GH y 63”. Entonces se 
puede escribir (2-15) como 

(2-16) XxX =PX". 


Como GB y G' son conjuntos linealmente independientes, X = 0, si, y solo si, 
X' = 0, Así, de (2-16) y del Teorema 7 del Capítulo 1, se sigue que P es inver- 
sible. Luego 


(2-17) Xx” = PX. 


SI se usa la notación introducida anteriormente para la matriz de coordenadas 
de un vector respecto a una base ordenada, entonces (2-16) y (2-17) dicen que 


lala = Plale 
lala = P-*[0]a. 
Con lo que lo anterior puede resumirse asi. 
Teorema 7. Sea V un espacio vectorial de dimensión n sobre el cuerpo F, 


y sean BR y 63" bases ordenadas de V. Entonces existe una única matriz n x n, 
necesariamente inversible, con elementos de F, de modo que 


á) [da = Plolay 
(ii) [a] = Pala 


para todo vector a de V. Las columnas de P están dadas por 


P; = [a;]g, j=1,..., mn. 
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Para completar cl análisis anterior, se demostrará también el siguiente 
lvorcma. 


Teorema 8. Supónguse que P es una matriz inversible n x n sobre F. Sea 
lun espacio vectorial de dimensión n sobre F, y sea (Bf una base ordenada de V. 
Intonces existe una base ordenada (B', única, de V tal que 


(i) [013 = PLae1g; 
pura todo vector a en V. 
Demostración. Sea (3, que consta de los vectores %,, ..., A,. Si (B' = 
si... ., 0, es una base ordenada de V, para la cual se tiene (i), es claro que 


n 
0% = z P sjQO. 
qg2 


Así, solo se necesita demostrar que los vectores a;, definidos por estas igual- 
dindes, forman una base. Sea Y = P”?. Entonces 


Y Quo = 3 Qu2 Pijas 
3 3 9 
= 22 Pi Qs os 
Ot 
= (2 PiQj) a 
; G ” 5) 
= Ok. 
Con lo que el subespacio generado por el conjunto 
B' = [ai,..., an) 
contiene a 6 y, por tanto, es igual a V. Así que (3' es una base, y por su defini- 
cion y por el Teorema 7 es claro que (i) es válido y también lo es (ii). | 
Ejemplo 18. Sea F un cuerpo y sea 
a = (21, Za, ..., Tn) 
un vector de F”. Si G es la base ordenada canónica de F”, 
BG = ler, . - - , En) 
la matriz de coordenadas del vector a en la base (B está dada por 
4 
Le 
lala =| + P 
Ln 


Ejemplo 19. Sea R el cuerpo de los números reales y sea O un número real 


dido. La matriz 
P= poes 0 —sen 7! 
sen 0 cos 6 
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es inversible con inversa, 


pa=| cos 6 sen6] 
—senÚ0 cos 6 


Así que para cada 0, el conjunto (B” que consta de los vectores (cos 6, sen 0), 
(sen 6, cos 0) es una base de R?; intuitivamente esta base puede ser descrita 
como la obtenida por rotación de ángulo 0 de la base canónica. Si a es el vector 


(1, x2), entonces 
[ale = | cosÓ sen a [5] 
a —senó cos 0 Lzs 


, 


T1 Z¡ COS Ó + za sen 0 
, 


Tm = —x,sen 0 + ze cos 0. 


Ejemplo 20. Sea F un subcuerpo de los números complejos. La matriz 


—-1 4 5 
P = 0 2 —3 
0 0 8 
es inversible con inversa 
-1 2 1 
Pi=| 03 
00 5% 
Así los vectores 
oa = (1, 0, 0) 
oa=( 4, 2,0) 


forman una base (f$' de F3. Las coordenadas x;, x,, x3 del vector a = (x,, X2, X3) 
en la base (B' vienen dadas por 


z1 —21 + 222 + “lxs —1 2 ZXllza, 
| = 312 + P5Ta = 0 2 És lll 
3 5% 00 ¿JLa 


En particular 
(3, 2, —8) = — 1001 — 3a2 — as. 


Ejercicios 
1. Demostrar que los vectores 


a] = (1, 1, 0, 0), da = (0, 0, 1, 1) 
3 = , 0, O, 4), o4 = (0, 0, O, 2) 


forman una base de R*. Hallar las coordenadas de cada uno de los vectores de la base ca- 
nónica respecto de la base ordenada (a,, %,, Az, Uy). 
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2 Hallar la matriz de coordenadas del vector (1, 0, 1) en la base de C? formada por los 
mitoros (21, 1, 0), (2, —1, 1), (0, 1 + ¿ 1 — ¿), en ese orden. 


3 Sea 63 = [a,, %, %,) la base ordenada de R?* formada por 
o = (1, 0, —1), a: = (1, 1, 1), a = (1, O, 0). 
¿Cuales son las coordenadas del vector (a, b, c) en la base ordenada (3? 


4 Sca W el subespacio de C? generado por a, = (1, 0, ¿) y a, = (1 + ¿ 1, —1). 
(1) Demostrar que a, y a, forman una base de W. 
(b) Demostrar que los vectores f, = (1, 1, 0) y fB, = (1, í, 1 + ¿) pertenecen a W 
y lorman otra base de W. 
(c) ¿Cuáles son las coordenadas de a, y a, en la base ordenada ([f8,, fB,) de W? 


4. Sean a = (x,, x2) y 6 = (y,, y2) dos vectores de R? tales que 
mmtrig=0, i+x3=y+ty=l. 


demostrar que (B = (a, $) es una base de R?. Hallar las coordenadas del vector (a, b) en 
la base ordenada (3 = (a, Bj. (Las condiciones impuestas a a y f dicen, geométricamente, 
que a y f£ son perpendiculares y de longitud 1.) 


h. Seca Y el espacio vectorial sobre los números complejos de todas las funciones de R 


vn (; es decir, el espacio de todas las funciones sobre el eje real a valor complejo. Sea 
id = 1, £0) =e%, f40Q) = e ”. 

(a) Demostrar que f,. f, y f, son linealmente independientes. 

(b) Sea e,(x) = 1, g,(x) = cos x, ga(x) = sen x. Hallar una matriz inversible 3 x 3, P, 
tul que 


3 
gi >= 2 Psifi. 
5] 
7. Sea V el espacio vectorial (real) de todas las funciones polinomios de R en R de grado 


' y menor; es decir, el espacio de todas las funciones de la forma 


fx) = Co + cz + cez?, 


Sea / un número real fijo y definase 
ir) =1, —g(x)=x+t gx) = (+0 


demostrar que (Bf = ([g,, £2, 83) es una base de V. Si 


f(x) = Co + Cyjx + Car? 


¿Cuales son las coordenadas de f en esta base ordenada (3? 


2.5. Resumen de equivalencia por filas 


En esta sección se usarán unos hechos elementales referentes a bases y di- 
mensión en espacios vectoriales de dimensión finita para completar el trata- 
miento de la equivalencia de matrices por filas. Se recuerda que si A es una 
mutriz m x n sobre el cuerpo F, los vectores fila de A son los vectores %,, . . . , O, 
de F” definidos por 


a; = (An, ... 37 Á in). 
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y que el espacio de filas de A es el subespacio de F” generado por estos vecto- 
res. El rango de fila de A es la dimensión del espacio de filas de A. 

Si P es una matriz k x m sobre F, entonces el producto B = PA es una ma- 
triz k x n cuyos vectores fila f,, .... B, son combinaciones lineales 


Bi = Pao + ++: + P mn Om 


de los vectores fila de A. Así el espacio de filas de B es un subespacio del espacio 
de filas de A. Si P es una matriz inversible m x m, entonces B es equivalente 
por filas a A, de modo que la simetría de la equivalencia por filas, o la igualdad 
A = P"?B, indica que el espacio de filas de A es también un subespacio del 
espacio de filas de B. 


Teorema 9. Las matrices equivalentes por filas tienen el mismo -“spacio 
de filas. 


De este modo se ha visto que para estudiar el espacio de filas de A se puede 
estudiar el espacio de filas de una matriz escalón reducida por filas que es equi- 
valente por filas a A, como se hará en seguida. 


Teorema J0. Sea R una matriz escalón no nula reducida por filas. Enton- 
ces los vectores fila no nulos de R forman una base del espacio de filas de R. 
Demostración. Sean Py, ..., P, los vectores fila no nulos de R 


pi = (Ra, .. .«- Rin). 


Ciertamente estos vectores generan el espacio de filas de R; se necesita solo 
demostrar que son linealmente independientes. Como R es una matriz escalón 


reducida por filas, hay enteros positivos k;,, ..., k, tales que, para [< r 
(a) R(,j=0 si j<k, 
(2-18) (b) R(, k;) = 85 
(0) k, < --- < k,. 
Supóngase que f$ = (b,, ..., b,) sea un vector del espacio de filas de R: 
(2-19) B = Cipi + -** + Copr. 


Se afirma entonces que c;, = b,,. En efecto, por (2-18) 


(2-20) bi, = Y c¿R(r, k;) 
i=1 
= 2, C;05j 
t=1 
= Cj 
En particular, si f = 0, es decir, si c¡P, + *:* +€,p, = 0, entonces c; debe 
ser la k-ésima coordenada del vector nulo, con lo que c¿=0,j=1...., r. 


Así, pues, Pi, ..., P, Son linealmente independientes. |] 
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Teorema UL, Sean m y n dos enteros postlivtos y sea F un cuerpo. Supóngase 
gue Weoes un subespacio de F" y que dim W < m. Entonces existe exactamente 
ma sola matriz escalón m x n reducida por filas sobre F que tiene a W como 
w capacio de filas. 


Demostración. Hay al menos una matriz escalón reducida por fila 
m xn con espacio de filas W. Como dim W < m, se pueden elegir m vectores 
1... .., 0, de W que generan W. Sea A la matriz m x n con vectores fila x,,..., 
"., Y sca R la matriz escalón reducida por filas que es equivalente por filas a A. 
Il mtonces, el espacio de filas de R es W. 

Sca ahora R cualquier matriz escalón reducida por filas que tiene a W como 


t espacio de filas. Sean p,, ..., p, los vectores fila no nulos de R y supóngase 
que el elemento principal no nulo de p, esté en la columna k,, i= 1,..., r. 
llos vectores Py, .... p, forman una base de W. En la demostración del Teore- 
ma 10 se observó que si f$f = (b,, ..., b,) pertenece a W, entonces 
B= aa ++.“ + Crpr, 
y «, = b,,; en otras palabras, la expresión única de f$ como combinación lineal 
de los Pi» ---> Pp €S 
y 

(2 21) B = 2 B.pi- 

qu 


Asi, pues, cada vector f está determinado si se conocen las coordenadas b,,, 
IF — 1,...,r. Por ejemplo, p, es el vector único de W que tiene la k -ésima coor- 
denada 1 y las k¡-ésimas coordenadas O para ¡4 s. 

Supóngase que ff pertenece a W y que f $ O. Se afirma que la primera coor- 
dcnada no nula de $f está en una de las columnas k,. Como 


B = 2 Dx,ps 
y B +0 se puede escribir 
(2-22) fp = 2 Dx,Pi, bx, 0. 
18 
l»e las condiciones (2-18) se tiene R;¡¡=0 si ¿>s y j > k,. Con lo que 


B= (0,...,0, Dr.) - - - , Dn), bx, 7 0 


y la primera coordenada no nula de ff está en la columna k,. Obsérvese también 
que para cada k,, s = 1, ..., r, existe un vector en W que tiene su k,-ésima 
coordenada no nula, a saber Ps- 

Ahora es claro que R está determinada univocamente por W. La descrip- 
ción de R en términos de W es como sigue. Se consideran todos los vectores 
f=(b,....,b,)en W. Si f + O, entonces la primera coordenada no nula debe 
estar en alguna columna £: 


B=(0,...,0, b;,..., bn), b, 40. 


Sean k;,, .. ., Kk, aquellos enteros positivos £ tales que existe algún $ + 0 en W, 
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cuya primera coordenada no nula está en la columna £. Se disponen losk,,...,k, 
en el orden k, <k,<-::<k,. Para cada uno de los enteros positivos k, 
habrá un vector p, y solo uno de W tal que la k,_-ésima coordenada de p, es 1 y 
la k¡-ésima es O para ¡+ s. Entonces R es la matriz m x n que tiene los vecto- 
res fila p,, ..., Pp, 0, ..., O. | 


Corolario. Cada matriz m x n, A, es equivalente por filas a una, y sola- 
mente una, matriz escalón reducida por filas. 


Demostración. Sabemos que A es equivalente por filas, al menos, a una 
matriz escalón reducida por filas. Si A es equivalente por filas a otra matriz 
escalón R”, entonces R es equivalente por filas a R'; luego, R y R' tienen el mis- 
mo espacio de filas y deben ser idénticas. | 


Corolario. Sean A y B matrices m x n sobre el cuerpo F. Entonces A y B 
son equivalentes por filas si, y solo si, tienen el mismo espucio de filas. 


Demostración. Se sabe que si A y B son equivalentes por filas, entonces 
tienen el mismo espacio de filas. Supóngase ahora que A y B tengan el mismo 
espacio de filas. Ahora A es equivalente por filas a una matriz escalón reducida 
por filas R, y B es equivalente por filas a una matriz reducida por filas R”. Como 
A y B tienen el mismo espacio de filas, R y R” tienen el mismo espacio de filas. 
Con lo que R = R' y A es equivalente por filas a B. |] 

En resumen, si A y B son dos matrices m x n sobre el cuerpo F, las siguien- 
tes afirmaciones son equivalentes: 


l. A y B son equivalentes por filas. 
2. A y B tienen el mismo espacio de filas. 
3. B=PA, donde P es una matriz inversible m x m. 


Una cuarta afirmación equivalente es que los sistemas homogéneos AX = 0 
y BX = 0 tienen las mismas soluciones; sin embargo, aun cuando se sabe que 
la equivalencia por filas de A y B implica que estos sistemas tienen las mismas 
soluciones, es más conveniente dejar la demostración del reciproco para más 
adelante. 


2.6. Cálculos relativos a subespacios 


Queremos ahora mostrar cómo las operaciones elementales por filas dan un 
método normalizado para responder a ciertas preguntas concretas concer- 
nientes a subespacios de F”. Ya hemos deducido lo que vamos a necesitar. El 
análisis es válido para cualquier espacio vectorial Y de dimensión n sobre el 
cuerpo F, si se elige una base ordenada GB fija y se expresa cada vector a de V 
por la n-tuple (x;, ..., xn) que da las coordenadas de a en la base ordenada GH. 

Supóngase que se han dado m vectores %;,, ..., 0, pertenecientes a F”. Con- 
sideremos las siguientes preguntas: 

1. ¿Cómo se determina si los vectores a,, ..., a,, son linealmente inde- 
pendientes? O en términos generales, ¿cómo se determina la dimensión del 
subespacio W generado por estos vectores? 
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2. Dado f en F”, ¿cómo se determina si fí cs una combinación lineal de 
hn. ..., 0, €0s decir, si fí pertenece al subespacio W? 
y. ¿Cómo se puede dar una descripción explícita del subespacio W? 


lu tercera pregunta es algo vaga, ya que no se especifica qué se entiende 
por una «descripción explicita»; sin embargo, ello se aclarará cuando se dé 
el tipo de descripción que se tiene en mente. Con esta descripción las pregun- 
tu (1) y 2) pueden contestarse inmediatamente. 

Sca Á una matriz m x n con vectores fila a;: 


a; = (As, .. .7 Á in) 


Mayase una sucesión de operaciones elementales por fila, empezando con A 
justa terminar con una matriz escalón reducida por fila R. Anteriormente ya 
re indicó cómo se hace esto; ahora, la dimensión de W (el espacio de filas de 4) 
queda de manifiesto, ya que esta dimensión es simplemente el número de vec- 


tores fila no nulos de R. Si p,, ..., p, son los vectores fila no nulos de R, en- 
tonces B= fp,, ..., p, | es una base de VW. Si la primera coordenada no nula 
de pp, es la coordenada k,-ésima, se tiene entonces para í < r 

(1) R(Gp=0, sí ¿<ks 

(d») R(i, k;) = 0;; 

(4) k, < +++ < k,. 


ll subespacio W consta de todos los vectores 
B = Cipi + *** + Crpr 
r 
= Z Cci(Ra, ...3 Rin). 
gu 


ls coordenadas b,, ..., b, de tal vector f, son entonces 
(9 23) bi= > CiRsj. 
¡=1 

ln particular, b,, = c;, y así, si B = (b,, ..., b,) es una combinación lineal 
le los p;,, debe ser la combinación lineal particular 
224) B = z Dr,Ps. 
l us condiciones sobre f que (2-24) ha de tener son 
(2-25) b, = 2 bi.R is, 3 = 1, e... N. 

¿=1 
Alura (2-25) es la descripción explícita del subespacio W generado por 
lis .--., Q,, esto es, el subespacio consta de todos los vectores f de F” cuyas 
vwwmordenadas satisfacen (2-25). ¿Qué tipo de descripción es (2-25)? En primer 
lugar describe W como todas las soluciones f = (b,, ..., b,) del sistema de 


reuaciones lineales homogéneas (2-25). Este sistema de ecuaciones es de una 
maturaleza muy especial, porque expresa (n — r) de las coordenadas como 
combinaciones lineales de las r coordenadas señaladas, by1, .. ., bx,. Se tiene 
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completa libertad para elegir las coordenadas b,; esto es, si C,, ..., Cc, son r €s- 
calares cualesquiera, existe un vector f de W y solo uno que tiene c, como su 
k¡-ésima coordenada. 

Lo significativo, aquí, es que: dados los vectores «a;, la reducción por fila 
2s un método directo para determinar los enteros r, k,, ..., k, y los escalares 
R¿¡ que dan la descripción (2-25) del subespacio generado por a,,..., 4%, Debe- 
mos observar, como hicimos en el Teorema 11, que todo subespacio W de F” 
tiene una descripción del tipo (2-25). También debemos hacer notar algunos 
aspectos respecto a la pregunta (2). Se ha determinado, en la Sección 1.4, cómo 
se puede hallar una matriz inversible m x m, P, tal que R = PA. El conoci- 
miento de P permite encontrar los escalares x,, ..., X,, tales que 


B = 21041 + ... + Im0m 


cuando ello es posible. En efecto, los vectores fila de R están dados por 
pi = Y Pia; 
j=l 


de modo que si f es una combinación lineal de los a,, se tiene 


PB = 2 Dr:pi 
= 2 b,, 2 Po; 
¿=] ¿ul 
=> 2 2, by,P ¡05 
julij=-1l 
con lo que 1j= Y b,,P;; 
fun 


es una posible elección de los x, (puede haber varias). 

La cuestión de si $ = (b,, ..., b,) es una combinación lineal de las «,, y 
en tal caso cuáles son los escalares x, se muede también considerar preguntán- 
dose si el sistema de ecnaciones 


2 Asti = ds, 3=1,...,n 


tiene solución y cuáles son las soluciones. La matriz coeficiente de este sistema 
es la matriz n x m, B, ton vectores columna A;, ..., Om. En el Capítulo 1 se 
estudió el uso de las operaciones elementales por fila para resolver un sistema 
de ecuaciones BX = Y. Consideremos un ejemplo en el cual adoptamos ambos 
puntos de vista para responder preguntas respecto a subespacios de FF”. 


Ejemplo 21. Consideremos el siguiente problema. Sea W el subespacio 
de R* generado por los vectores 


a = (1, 2, 2, 1) 
Ag = (0, 2, 0, 1) 
az = (—2, 0, —4, 3). 
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(1) Demostrar que a,, 7, 3 forman una base de W, es decir, que estos 
vectores son linealmente independientes. 

(b) Sca f = (b,, b,, b3, b¿) un vector de W. ¿Cuáles son las coordenadas 
de ff respecto a la base ordenada (a,, %,, 03)? 

(c) Sean 
= (1, 0, 2, 0) 
= (0, 2, 0, 1) 
= (0, 0, 0, 3). 


2 2 2 


Demostrar que a, %,, 3 forman una base de W. 

(d) Si f pertenece a W, se designa por X la matriz de coordenadas de $ 
imspecto a la base de los a, y por X” a la matriz de coordenadas de f respecto 
aw la base de los a”. Hallar la matriz 3 x 3, P, tal que X = PX” para cada una 
di: tales $. 

Para responder estas preguntas por el primer método se forma la matriz A 
con vectores fila x,, a,, 13, se determina la matriz escalón reducida por filas R, 
gue es equivalente por filas a A, y haciendo las mismas operaciones sobre la 
matriz identidad se obtiene la matriz inversible O, tal que R= QA: 


12 2 1 1020 
02 0 1l>r=l0 100 
-2 0 -4 3 00.0 1 
100 6 —6- 0 
0 1 0|>2Q=3|-2 5 -1 
0 0 1 4 -4 2 - 


(a) Evidentemente R es de rango 3, con lo que %,, %,, A, son indepen- 
dientes. 

(b) ¿Qué vectores f$ = (b,, b,, b,, b¿) pertenecen a W? Se tiene la base 
de W dada por p,, P», P3, que son los vectores fila de R. A la vista está que el 
espacio generado por p,, Pz, P3 consta de los vectores $ para los que b, = 2b,. 
Para un $ tal, se tiene 


PB =b,p, + b2P2 + bap3 
= [6,, ba, bIJR 

[b, bz b1]QA 

1101 + Zo + 130% 


ll 


donde Xi = [0, b, b3]0;: 


Y = b, — 3b2 + 3D4 
(2-26) To —b, + Hb. — 2b4 
L3 — Hb, + G04. 


(c) Los vectores a.;, a.;, a, son todos de la forma (y,, yz, Ya, Y4) CON y, = 2y,, 
y, por tanto, pertenecen a W. Es evidente que son linealmente independientes. 
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(d) La matriz P tiene por columnas 
P;, = [oy]a 
donde GH = [a,, dz, 43). Las ecuaciones (2-26 dicen cómo hallar la matriz de 
coordenadas para a;, a, a. Por ejemplo, con f$f = a; se tiene b, = 1, b, = O, 
by == 2, ba = 0, y 


y 1 — 4(0) + 4(0) = 1 
xs = —1 +00) — 3(0) = —1 
Ta — (0) + 3(0) = 0. 


Con lo que a, = %, — at. En forma semejante, se obtiene a, = a, y a = 


24, — 20, + 03. Luego 
1.0 2 
p É | 
0 0 1 


Ahora se verá cómo se responden las preguntas por el segundo método des- 
crito. Se forma la matriz 4 x 3, B, con vectores columna a,, %, 03: 


10 -2 
2 2 0 
B=l2 0 -a| 
Ir 1 3 
Inquirimos para cuáles y,, Y», Y3, Ya el sistema BX = Y tiene una solución. 
10 -—2 y 10 -2 Yi 
2 2 0 y _ 0 2 4 Y — 2y1 _, 
- 2 0 -4 y 0.0 O ys — 24 
1 1 3 y O 1 3 YY 
10 -2 Yi 100 YU-— 3y + 3 
0.0 -=6 y-—24| [0 0 1 6 (24 — ys) 
01. 5 yu-—y 0 1 0 —y + ¿y — ¿ya 
0 0 0 Ya — 241 0.00 Y3 241 


Asi la condición para que el sistema BX = Y tenga una solución es que yz = 2y,. 
Asi B = (b,, b,, b,, b¿) pertenece a W si y, solo st, b, = 2b,. Si f pertenece a 
W, entonces las coordenadas (x,, x,, x3) en la base ordenada [a,, a,, 03) se 
pueden leer de la ultima matriz anterior. Obtenemos nuevamente las fórmu- 
las (2-26) para esas coordenadas. 

Las preguntas (c) y (d) se responden como antes. 


Ejemplo 22. Consideremos la matriz 5 x 5 


1 2 0 30 
12 —1 -150 
A =|0 O 1 4 0 
2 4 1 10 1 
0 0 0 O 1 


y los siguientes problemas concernientes a A. 
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(a) Hallar una matriz inversibie P, tal que PA seca una matriz escalón 
ieducida por filas R. 

(bp Hallar una base para ei espacio de filas W de A. 

(c) Determinar qué vectores (b,, b,, b3, ba, bs) están en W. 

(d) Hallar la matriz de coordenadas de cada vector (b,, b,, bx, ba, b5) 
de 11 en la base ordenada elegida en (b). 

(0) Escribir cada vector (£,, b,, b3, ba, bs) de W como una combinación 
incal de las filas de A. 

(f) Dar una descripción explícita del espacio vectorial V de todas las ma- 
times columnas de 5 x 1, X, tales que AX = 0. 

(y) Hallar una base de V. 

(h) ¿Para qué matriz columna 5 x 1, Y, la ecuación AX = Y tiene so- 
luiciones X? 


Para resolver estos problemas se forma la matriz aumentada A' del sis- 
tema AX = Y y efectuando una sucesión apropiada de operaciones por filas 
sobre A”: 


1 2-1 -10 my 00 -1 -4 0 —Y+v 
VO 1 40qg]—jo00 1 40 Ya > 
2 4 1. 10 1 y 0 0 1 4 1 —24 +yvs 
00 0 01m 00 Oo 01 Ye 
12030 Ya 
00140 Y — Y 
00000 —y+y+y |» 
00001 —3+yz+Yy 
0000 m1 Yo 
00140 Y1 — Y 
00000 —Y1 + Ya + Ya 
00000 —3Y, + Y2 + Ya — Yo 
(a) Si 
Y1 
Y1 — Ya 
PY = Y6 
—Y + Ya + Ya 


—3Y1 + Ya + Ya — Yo 
pura todo Y, entonces 


1 0050 0 
1-J]00 0 

P = 0 0.0.0 1 
—1 1150 0 

—3 101 s—1 
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luego PA es la matriz escalón reducida por filas 
12030 


ed 

ll 
ocooo 
oooo 
ooo» 


0 
11 
0 
0 


O OSO DO 


Se debe resaltar que la matriz P no es única. Existen, de hecho, muchas matri- 
ces inversibles P (que provienen de los diferentes modos de elegir las opera- 
ciones usadas para reducir 4”) tales que PA = R. 

(b) Una base de W se puede tener al tomar las filas no nulas 


p=(0 0 1 4 0) 
de R p=(0 00.0 1) 
e R. 
(c) El espacio de filas W consta de todos los vectores de la forma 
8 = Cipr + Copa + Caps 
= (C1, 2c1, Ca, 3C1 + 4c2, C3) 


donde c;,, c,, cz son escalares arbitrarios. Así, (b,, ba, b3, ba, bs) pertenece a W 
si y, solo si, 
(Dr, da, bz, da, bs) = bipi + dap2 + deps 

lo que es cierto si y, solo si, 

ba = 2b, 

ba = 3b, + 4b3. 
Estas ecuaciones son casos particulares del sistema general (2-25), que se puede 
usar para ver inmediatamente si un vector dado pertenece a W. Así, (—5, —10, 
1, —11, 20) es una combinación lineal de las filas de A, pero (1, 2, 3, 4, 5) no lo es. 

(d) La matriz de coordenadas del vector (b,, 2b,, bx, 3b, + 4b,, bs) en 

la base p, Pp», P3 es evidentemente 


H 


(e) Hay varias maneras de escribir los vectores de W como combinacio- 
nes lineales de las filas de 4. Tal vez el método más fácil es seguir el primer pro- 
cedimiento del Ejemplo 21 anterior: 


8 = (b1, 2b,, ba, 3b1 + 4b3, bs) 
= [b1, Da, Ds, 0, 0] . R 
= [b, ba, ds, O, O] - PA 


1 0.0.0 0 
1 -—1050 0 
= [b,, b3, dy, O, 0] 0 0 0 0 11-4 
—1 1 1 0 0 
2-3 1016-1 


= [b, + ba, — bz, O, O, bs) . Á. 
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ln puesticalar, con f= (—=S, —10, 1, —11, 20) se tiene 


1 2 0 3 0 
12 -1 -150 
A =(—4,—1,0,0,20)0 O 1 4 Ol 
2 4 1 10 1 
0 0 0 O 1 
(1) Las ecuaciones en el sistema RX = 0 son: 
21, + 222 + 324=0 
Ya + 4x4 =0 
Tp = O. 
ton lo que V consta de todas las columnas de la forma 
—:zxo — 3L4 
La 
X = —d42, ” 
L4 
0 
dende x, y x¿ son arbitrarios. 
(y) Las columnas 
—2 —3 
1 0 
0 —4 
0 1 
0 0 


lnmnwn una base para Y. Este es un ejemplo de la base descrita en el Ejemplo 15. 
(h) La' ecuación AX = Y tiene las soluciones X si y, solo si, 


—Y + Ya + Ya = () 
—3Y + Ya + Ya — Ys = 0. 


ljercicios 
l. Secas < ny A una matriz s x n con elementos en el cuerpo F. Usando el Teorema 4 
(no su demostración), demostrar que existe un Y no nulo en F”*? tal que AX =0. 
2. Scan 
a = (1,1, —2, 1), at = (3, 0, 4, —1), ay = (—1, 2, 5, 2). 
y san 
a = (4, —5, 9, —7), B = (3, 1, —4, 4), y = (—1,1,0, 1). 


(1) ¿Cuál de los vectores a, f. y pertenece al subespacio R* generado por los «,? 
(b) ¿Cuáles de los vectores a, f, y están en el subespacio de C* generado por los a,? 
(c) ¿Sugiere esto algún teorema? 
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luego PA es la matriz escalón reducida por filas 


1205350 
00140 
R=|0 0.00 1 
00000 
00000 


Se debe resaltar que la matriz P no es única. Existen, de hecho, muchas matri- 
ces inversibles P (que provienen de los diferentes modos de elegir las opera- 
ciones usadas para reducir A”) tales que PA = R. 

(b) Una base de W se puede tener al tomar las filas no nulas 


p=(0 0 1 4 0) 
de R p¿=0 0 0.0 1) 
e R. 
(c) El espacio de filas W consta de todos los vectores de la forma 
B = Cips + Capaz + Caps 
= (cr, 2C1, Ca, 3C1 + 4cz, Ca) 


donde c,, c,, c¿ son escalares arbitrarios. Así, (b,, b,, b3, ba, bs) pertenece a W 
si y, solo si, 
(br, bo, bz, ba, ds) = bipr + bap2 + Dope 

lo que es cierto si y, solo si, 

ba = 2b, 

ba = 3b, + 4b3. 
Estas ecuaciones son casos particulares del sistema general (2-25), que se puede 
usar para ver inmediatamente si un vector dado pertenece a W. Asi, (—5, —10, 
1, —11, 20) es una combinación lineal de las filas de A, pero (1, 2, 3, 4, 5) no lo es. 

(d) La matriz de coordenadas del vector (b,, 2b,, b,, 3b, + 4b,, b5) en 

la base p, p,, p3 es evidentemente 


ej 


(e) Hay varias maneras de escribir los vectores de W como combinacio- 
nes lineales de las filas de A. Tal vez el método más fácil es seguir el primer pro- 
cedimiento del Ejemplo 21 anterior: 


B = (b,, 2b,, ba, 3b, + 4b,, b5) 
= [b,, b3, bs, O, 0] -R 
= [b,, bz, de, 0, 0] . PA 


1.000 07 
11-100 0 

= [b,,b3,bs, 0,0] 0 0.0.0  1|-4 
-1. 110.0 
3 101-1 


= [b, + b3, —b3, O, O, bs] - A. 
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ln particular, con fi = (-5, —10, 1, —11, 20) se tiene 


12 0.30 
12 -1 -10 
B=(-4,-1,0,0,20)|0o 0 1 4 Ol 
24 1 10 1 
00 0 01 


(1) Las ecuaciones en el sistema RX = 0 son: 


z1 + 222 + 3x4 =0 
13 + Axa = 0 
xp = 0. 


Con lo que V consta de todas las columnas de la forma 


—22o — 3Za 

L2 

X = —Azxa Ñ 
La 
0 
dende x, y x¿ son arbitrarios. 
(y) Las columnas 

—2 —3 
1 0 
0 —4 
0 1 
0 0 


lorman una base para Y. Este es un ejemplo de la base descrita en el Ejemplo 15. 
(h) La' ecuación AX = Y tiene las soluciones X' si y, solo si, 


—Y + Ya + Ya = ( 
—3YN + Ya + Ya — Ys = 0. 


Iijercicios 
Í. Seas < ny A una matriz s x n con elementos en el cuerpo F. Usando el Teorema 4 
(mo su demostración), demostrar que existe un X no nulo en F”"*!* tal que AX =0. 
?. Scan 
Aj = (1, l, —2, 1, a = (3, 0, 4, —1), Ag = (-1, 2, 5, 2). 
y wun 
a = (4, —5, 9, —7), B = (3, 1, —4, 4), y = (-1, 1, O, 1). 


(1) ¿Cuál de los vectores a, ff, y pertenece al subespacio R* generado por los a,? 
(b) ¿Cuáles de los vectores a, f, y están en el subespacio de C* generado por los «;? 
(c) ¿Sugiere esto algún teorema? 
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3. Considerar los vectores en R* definidos por 

om = (—1,0, 1, 2), ot = (3, 4, —2, 5), als = (1, 4, 0, 9). 
Hallar un sistema de ecuaciones lineales homogéneas para las que el espacio de las solu- 
ciones sea exactamente el subespacio de R* generado por los tres vectores dados. 


4. En C?, sean 


a=(1,0,—D, «a=(14+%1-%4D, 0 =(,11). 


Demostrar que estos vectores forman una base de C?. ¿Cuáles son las coordenadas del 
vector (a, b, c) en esta base? 


5. Dar una descripción explícita del tipo (2-25) para los vectores 


B = (61, ba, bz, ba, bs) 


de R$ que son combinaciones lineales de los vectores 


o1 = (1,0, 2, 1, —1), as = (—1, 2, —4, 2, 0) 
1 4 = (2, 1, 3, 5, 2). 


6. Sea V un espacio vectorial real generado por las filas de la matriz 


321 0 9.0 
1 7 -1 -2 -—1 
214 0 6 1l 
6 42 -—-1 13 0 


(a) Hallar una base para Y. 

(b) ¿Qué vectores (X,, X», X3, Xa, xs) son elementos de V? 

(c) Si (x1, X2, X3, Xa, X5) pertenece a V, ¿cuáles son sus coordenadas en la base ele- 
gida en la parte (a)? 


7. Sea A urna matriz m x n sobre el cuerpo F y considerar el sistema de ecuaciones AX= Y. 
Demostrar que este sistema de ecuaciones tiene una solución si, y solo st, el rango de fila 
de A es igual al rango de fila de la matriz aumentada del sistema. 


3. Transformaciones lineales 


1,1, Transformaciones lineales 


Vamos a introducir ahora las transformaciones lineales, que es de lo que 
e: ttita en la mayor parte de lo que resta del libro. El lector encontrará de utili- 
«lil leer (o releer) el estudio sobre funciones en el Apéndice, ya que se hará 
wmplio uso de la terminología pertinente. 


Definición. Sean V y W. dos espacios vectoriales sobre el cuerpo F. Una 
transformación lineal de V en W es una función T de V en W tal que 


Tíca + PB) = c(Ta) + TB 


pura todos los vectores a y fB de V y todos los escalares c de F. 


I:iemplo 1. Si V es cualquier espacio vectorial, la transformación identidad 
l, detinida por Za = qa, es una transformación lineal de V en V. La transfor- 
mación cero O, definida por Ox = O, es una transformación Jineal de Y en Y. 


ljemplo 2. Sea F un cuerpo y sea V el espacio vectorial de las funciones 
polmomios f de F en F, dado por 


Ñ J2) =0 + ar+ --- + egzr. 
va 


(Df) = C1 + 2c2x + --- + kogrtl, 


lntonces D es una transformación lineal de V en V: la transformación deri- 
tición. 
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Ejemplo 3. Sea A una matriz m x n dada, con elementos en el cuerpo F. 
La función T definida por 7(X) = AX es una transformación lineal de F"*? 
en F”*!. La función U definida por U(a) = «4 es una transformación lineal 
de F” en F". 


Ejemplo 4. Sea P una matriz m x m dada, con elementos en el cuerpo F, 
y sea O otra matriz n x n dada, sobre F. Se define una función T' del espacio 
F”*" en sí mismo por 7(4) = PAQ. Entonces T' es una transformación lineal 
de F"*" en F”*”, porque 


T(CA + B) = P(cA + BN 

(PA + PB)Q 
cPÁQ + PBQ 
cT(A) + T(B). 


Ejemplo 5. Sea R el cuerpo de los números reales y sea V el espacio de 
todas las funciones continuas de R en R. Se define T' por 


INE = 10 a. 


Entonces T es una transformación lineal de Y en V. La función 7f no solo es 
continua, sino que también tiene primera derivada continua. La linealidad de la 
integración es una de sus propiedades fundamentales. 

El lector no tendrá dificultades en verificar que las transformaciones de- 
finidas en los Ejemplos 1, 2, 3 y 5 son transformaciones lineales. La lista de 
ejemplos se ampliará considerablemente cuando se estudien más aspectos de 
las transformaciones lineales. 

Es importante observar que si 7 es una transformación lineal de V en W, 
entonces 7(0) = 0: lo que se ve por la misma definición, pues 

T(0) = T(0 +0) = T(0) + T(0). 

Este punto es a menudo motivo de confusión para quien estudia álgebra lineal 
por primera vez, ya que probablemente haya tenido una visión un poco dife- 
rente del uso del término «función lineal». Un breve comentario al respecto 
podría aclarar esa confusión. Supóngase que V es el espacio vectorial R*. Una 
transformación lineal de V en V es entonces un tipo especial de función real 
en el eje real. En un curso de cálculo es probable que se diga que tal función 
es función lineal si su grafo es una recta. Una transformación lineal de R* en R?, 
de acuerdo con la definición, será una función de R en R cuyo grafo es una recta 
que pasa por el origen. 

A más de la propiedad 7(0) = O indiquemos otra propiedad general de la 
transformación lineal 7. Tal transformación «preserva» las combinaciones linea- 
les; esto es, Si 1, . . . , A, Son vectores de Y y c,, ..., c, son escalares, entonces 


T(ciar + + CnQ,) = c( Tar) + + Cal T An). 
Ello resulta directamente en forma en forma directa de la definición. Por ejemplo, 


T(cior +4 C20t2) = ci(Ta;) +4 T(c202) 
= ci(Tar) + cal Tas). 
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Teorema 1. Sea V un espacio vectorial de dimensión finita sobre el cuerpo 
lee day, ..., 0,) una base ordenada de V. Sean W un espacio vectorial sobre 
vil musmo cuerpo F y B,, ..., fB, vectores cualesquiera de W. Entonces existe una 
nica transformación lineal de T de V en W tal que 


Ta, = Pj, j=1l,..., 7. 


Demostración. Para demostrar que existe una transformación lineal T 
tl que Ta, = f, se procede como sigue. Dado a de Y, existe una única n-tuple 
Id, ..., Xx.) tal que 


a = tjo04 + ... + IO. 
l'ura ese vector a se define 
Ta =.2181 + ... + Trfr. 


lntoences, T7' es una correspondencia bien definida que asocia a cada vector a 
le 1 un vector Ta de W. De la definición queda claro que Ta, = f, para cada ¡. 
Para ver que T es lineal, sea 


PB = y101 + +** + YnQn 
lv 1' y sea c cualquier escalar. Ahora 
ca + B = (ca + y )oa + -+- + (CZn + YnJan 
vom lo que, por definición, 
T(ca + B) = (ca + y YB + ++ + (c2, + yn)óa. 


lo otra parte, 


Ta) + TB =0 3 58:+ 3 yá 


= 2 ler + y)6: 
Y 181 
T(ca + fB) = c(Ta) + T£. 
51 U es una transformación lineal de Y en W con Ua, = Bj, j=1,....n, 


n 
entonces para el vector a = 2 tia; se tiene 
i=1 


U ( s 2:0:) 
1=1 


= y r:(Ux;) 


1=1 


Ua 


n 
= 2 2:56; 
¿=] 


con lo que U es exactamente la misma correspondencia T que se definió antes, 


lv que demuestra que la transformación lineal T con Ta, = f,, es única. | 
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El Teorema 1 es muy elemental, pero por su importancia ha sido presentado' 
detalladamente. El concepto de función es muy general. Si Y y W son espacios 
vectoriales (no nulos), hay una multitud de funciones de Y en W. El Teorema 1 
destaca el hecho de que las funciones que son lineales son muy especiales. 


Ejemplo 6. Los vectores 
ay = (1, 2) 


a = (3, 4) 
son linealmente independientes y, por tanto, forman una base de R?. De acuer- 
do con el Teorema 1, existe una única transformación lineal de R? en R? tal qu 
Tor = (3, 2, 1) 
Tas = (6, 5, 4) 


| 


De ser así, se debe poder encontrar T(€, ). Encontrados los escalares c,, c, tales 
que €, = C,%, + cza,, se sabe entonces que Te, = c,Ta, + czTa,. Si (1, 0) = 


Ci (1, 2) + c,(3, 4), entonces c, = —-2 y cz, = 1. Con lo que 
T(1, 0) = —2(3, 2, 1) + (6, 5, 4) 
= (0, 1, 2). 


Ejemplo 7. Sea T una transformación lineal del espacio de los m-tuples 
F” en el espacio de los n-tuples F”. El Teorema 1 dice que T' está univocamente 
determinado por la sucesión de vectores f,, ..., PB, donde 


Bi = Tes, ¿2=1,...,m. 


Dicho brevemente, T' está univocamente determinado por las imágenes de los 
vectores de la base canónica. Esta determinación es 


a = (La, - - - » Tm) 


Ta = 2181 + ::: + ImBm. 


Si B es la matriz m x n que tiene por filas los vectores fB,, .... f,,, esto quiere 
decir que 
Ta = aB. 
O sea que si f; = (Bjy, .- - , Bin), entonces 
Bu --- Ba 
T(%1, ..., Tn) = [21 --- 2m] |: : . 
Bt e... Bn 


Esta es una descripción muy explícita de la transformación lineal. En la Sec- 
ción 3.4 se hará un estudio detallado de la relación entre las transformaciones 
lineales y las matrices. No se “seguirá con la descripción particular Ta = aB, 
porque tiene la matriz B a la derecha del vector a y ello puede inducir a confu- 
sión. La razón de este ejemplo es hacer ver que se puede dar una descripción 
explicita y razonablemente simple de todas las transformaciones lineales de 
F” en F". 
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Si T' es una transformación lineal de Y en W, entonces la imagen de 7 no 
es solo un subconjunto de W, sino un subespacio de W. Sea R7 la imagen de T; 
ento es, el conjunto de todos los vectores f de W tales que f = Ta, para algún 
wn PH. Scan f, y f, de R, y sea c un escalar. Existen vectores a, y a, de Y 
ines que Ta, = BB, y Ta, = fB,. Como T es lineal 


T(cay + 013) = cToy + Tas 
= CB, + B:, 


lo que dice que cf, + f, pertenece también a R7. 

Otro subespacio interesante asociado con la transformación lineal T es el 
vonjunto N, que consta de los vectores a en V tales que Ta = 0: es un subes- 
puero de Y, pues 


(1) T7(0) = O, con lo que N no es vacío. 
(hb) Sí To, = Ta, = 0, entonces 


T(coz + 03) = cTar + Tos 
=0+0 
= 0 


vet lo que ca, + a, pertenece a N. 


Definición. Sean V y W dos espacios vectoriales sobre el cuerpo F y sea T 
mw transformación lineal de V en W. El espacio nulo de T es el conjunto de todos 
lus vectores au de V tales que Ta = 0. 

Si V es de dimensión finita, el rango de T es la dimensión de la imagen de T y 
hi nulidad de T es la dimensión del espacio nulo de T. 


He aquí uno de los resultados más importantes del álgebra lineal. 


Teorema 2. Sean V y W espacios vectoriales sobre el cuerpo F y sea T una 
nminsformación lineal de V en W. Supóngase que V es de dimensión finita. Entonces 


rango (T) + nulidad (T) = dim V. 


Demostración. Sea [a,,..., 0) una base de N, el espacio nulo de 7. Exis- 
ten Vectores +1, - . - > 0, €n V tales que [a,,..., a, ) es una base de Y. Podemos 
demostrar ahora que (To +1, ..-, Ta, es una base para la imagen de 7. Los 
vectores Tay, ..., To, generan evidentemente la imagen de 7, 'y tomo Ta; = 0 
pura f < k, se ve que T0%j+1, -.., 70, generan la imagen. Para ver que estos 
vectores son linealmente independientes, supóngase que se tienen escalares 
«, tales que 


S c(Ta;) =0. 
¡=k41 
sto dice que 


r( y cias) = ( 


1=*k+4-1 
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y en consecuencia, el vectora = 2  C¡% pertenece al espacio nulo de 7T.. 
s=k+1 


Como QA,, ..., 0%, forman una base de N, deben existir escalares b,, ..., 0 
tales que 


k 
a= Y bios. 
¡=1 


Con lo que 
k n | 
Zba¡—= Y cjaj=0 | 
¿=1 j=k+1 | 
y COMO %;,-..., a, son linealmente independientes, se debe tener 
bd, = --- =D; = Cin = +... =(,=0. 
Si el rango de T' es r, el hecho de que T0x+,, - - ., 7%, formen una base de: 


la imagen de T nos dice que r = n — k. Como k es la nulidad de 7 y n es la di- 
mensión de V, se tiene lo afirmado. 


Teorema 3. Si A es una matriz m x n de elementos en el cuerpo F. entonces 


rango de filas (A) = rango de columnas (A) 


Demostración. Sea T una transformación lineal de F"*!* en F”"*! definida 
por T(X) = AX. El espacio nulo de T es el espacio de soluciones del sistema 
AX = 0, es decir, el conjunto de todas las matrices columna Y tales que AX' = 0. 
La imagen de T es el conjunto de todas las matrices columna m x 1, Y, tales 
que AX = Y tiene una solución para X. Si A,, ..., A, son las columnas de A, 
entonces 


AX =xM4A1+ +: + 2ZnÁn 
de modo que la imagen de T es el subespacio generado por las columnas de A. 
Es decir, que la imagen de T es el espacio de las columnas de A. Por tanto, 
rango (7) = rango de columnas (4). 


El Teorema 2 dice que si S es el espacio de soluciones del sistema AX = 0, en- 
tonces 


dim S + rango de columnas (4) = n. 
Sea ahora el Ejemplo 15 del Capítulo 2. Ahí se vio que, si r es la dimensión 


del espacio de filas de A, entonces el espacio de soluciones S tiene una base 
que consta de n — r vectores: 


dim S = n — rango de filas (4). 
En consecuencia 
rango de filas (4) = rango de columnas (4). | 


La demostración del Teorema 3 que acaba de darse depende de cálculos 
explícitos con sistemas de ecuaciones lineales. Hay una demostración más 
conceptual que no se basa en tales cálculos. Se dará tal demostración en la 
Sección 3.7. 
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Pl jercicios 


Il, ¿Cuáles de las siguientes funciones T de R? en R? son transformaciones lineales? 


(a) T(z,, 22) = (1 + 21, 29); 
(db) T(21, Lo) = (xo, zx); 

(0) T(z, ze) = (11, 22); 

(d) T(z,, zo) = (sen z,, 2); 
(0) T(z<,, 22) = (21 — T2, 0). 


1 Hallar la imagen, rango, espacio nulo y nulidad para la transformación cero y la trans- 
luminación identidad en un espacio de dimensión finita V. 


Ut Describir la imagen y el espacio nulo para la transformación derivación del Ejem- 
qlo 2. Hacer lo mismo para la transformación: integración del Ejemplo $5. 


4  Nxiste una transformación lineal 7 de R? en R? tal que 7(1, —1, 1) = (1, 0) y 
tit. 1, 1) = (0, 1)? 


4 Si 
o = (1, —1), B1 = (1, 0) 
AY = (2, —1), B2 = (0, 1) 
os = (-3,2),  Pa= (1,1) 
¿liste una transformación lineal T de R? en R? tal que To, = f, para i = 1, 2, 3? 


ft. Describir explícitamente (como en los Ejercicios 1 y 2) la transformación lineal 7' de 
I' en F? tal que Te, = (a, b), Te, = (c, d). 


?, Sca F un subcuerpo de los números complejos y sea 7 una función de F?* en F? de- 
uba por 


T(x,, L2, 29) = (2, — + 223, 2x1 + L2) “TL — 219 + 2x3). 


(:1) Comprobar que T' es una transformación lineal. 

(b) Si (a, b, c) es un vector de F?, ¿cuáles son las condiciones para a, b y c de modo que 
e] vector pertenezca a la imagen de 7? ¿Cuál es el rango de T? 

(«) ¿Cuáles son las condiciones para a, b y c de modo que (a, b, c) pertenezca al espe- 
vto nulo de 7? ¿Cuál es la nulidad de 7? 


N. Describir explicitamente una transformación lineal de R?* en R? que tiene como ima- 
yn cl subespacio generado por (1, 0, —1) y (1, 2, 2). 


0. 5Sca V el espacio vectorial de todas las matrices n x n sobre el cuerpo F y sea B una ma- 
iz a x n dada. Si 


T(A) = AB-— BA 
vemprobar que T es una transformación lineal de V en Y. 


1. Sca V el conjunto de todos los números complejos considerado como un espacio 
veu torial sobre el cuerpo de los números reales (con las operaciones usuales). Hallar una 
luinción de Y en Y que sea una transformación lineal en dicho espacio vectorial, pero que 
ho sea una transformación lineal en C?*; es decir, que no sea lineal compleja. 


MN. Sea V el espacio de las matrices n x 1 sobre F y sea W el espacio de las matrices m x 1 
slbie F. Sea A una matriz m x n dada y sea T la transformación lineal de V en W, definida 
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por T(X) = AX. Demostrar que T' es la transformación cero si, y solo si, A es la matriz 
cero. 


12. Sea V un espacio vectorial Y de dimensión n sobre el cuerpo F y sea T una transforma- 
ción lineal de V en V tal que la imagen y el espacio nulo de T sean idénticos. Demostrar 
que n es par. (¿Se puede dar un ejemplo de tal transformación lineal 7”) 


13. Sea Y un espacio vectorial y T una transformación lineal de Y en V. Demostrar que 
las dos afirmaciones siguientes sobre Y son equivalentes. 
(a) La intersección de la imagen de T y el espacio nulo de T' es el subespacio cero de V. 
(b) Si 7(Ta) = O, entonces Ta = 0. 


3.2. Algebra de las transformaciones lineales 


En el estudio de las transformaciones lineales de V en W es de fundamen- 
ta] importancia que el conjunto de estas transformaciones hereda una estruc- 
tura natural de espacio vectorial. El conjunto de las transformaciones lineales 
de un espacio Y en sí mismo tiene incluso una estructura algebraica mayor, 
pues la composición ordinaria de funciones da una «multiplicación» de tales 
transformaciones. Se analizarán estas ideas en esta sección. 


Teorema 4. Sean V y W espacios vectoriales sobre el cuerpo F. Sean T y 
U transformaciones lineales de V en W. La función (T + U) definida por 


(7 + UlNa) = Ta + Ua 
es una transformación lineal de V en W. Si c es cualquier elemento de F, la función 
(cT) definida por 
(cTlKla) = c(Ta) 
es una transformación lineal de V en W. El conjunto de todas las transformaciones 


lineales de V en W, junto con la adición y la multiplicación escalar aquí definidas, 
es un espacio vectorial sobre el cuerpo F. 


Demostración. Supóngase que T y U son transformaciones lineales de 
V en W, que se define (7 + U) como se indicó. Entonces 


(T + U)ca + B) = Tlca + B) + Ulca + 6) 

c(Ta) + TB + c(Ua) + UB 

= c(Ta 4 Ua) + (TB + UB) 

c(T + U)(a) + (T + U)(6) 

que dice que (7 + U) es una transformación lineal. En forma análoga, 
(cT)(da + 6) = c[T (da + B)] 

cld(Ta) + TÉ] 

cd(Ta) + c(TB) 

= d[c(Ta)] + c(T8) 

= d[(cT)a] + (cT)8 


que dice que (cT') es una transformación lineal. 
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Para comprobar que cl conjunto de transformaciones lineales de Y en W 
(Junto con estas Operaciones) es un espacio vectorial, se debe verificar directa- 
ente cada una de las condiciones para la adición vectorial y la multiplica- 
vtón por escalar. Se dejan los detalles de esto al lector, bastando aquí los si- 
guientes comentarios: El vector cero en este espacio será la transformación 
ba. que transforma cada vector de V en el vector cero de W; cada una de las 
propiedades de las dos operaciones es consecuencia de la correspondiente 
ppopiedad de las operaciones en el espacio W. | 


ls conveniente mencionar otro modo de ver este teorema. Si se definen 
la auna y la multiplicación por escalar como se hizo antes, entonces el conjunto 
hb tudas las funciones de V en W es un espacio vectorial sobre el cuerpo F. Esto 
ho liene nada que ver con que Y sea un espacio vectorial, solo necesita que Y 
ss tim conjunto no vacío. Cuando V es un espacio vectorial, se puede definir 
nn transformación lineal de V en W, y el Teorema 4 dice que las transformacio- 
nar Iimuales forman un subespacio del espacio de todas las funciones de V en W. 

Se representará el espacio de las transformaciones lineales de Y en W por 
l (1, W). Se recuerda al lector que L(V, W) se define solo cuando V y W son 
espacios vectoriales sobre el mismo cuerpo. 


lcorema 5. Sea V un subespacio vectorial de dimensión finita n sobre el 
nsrpo F, y sea W un espacio vectorial de dimensión finita m sobre F. Entonces 
rl espacio L(V, W) es de dimensión finita y tiene dimensión mn. 


Demostración. Sean 


G=(0,...,4) y 6 =(B,...,Bm) 


hos ordenadas de V y W, respectivamente. Para cada par de enteros (p, q) 
vn l<p<myl1S<q<mnm se define una transformación lineal E”? de Y 


un por 
e si 1%q 
mM Si 1=q 


= dB p- 


ld» icuerdo con el Teorema 1, existe una transformación lineal única de Y en 
WM” «que satisface estas condiciones. Se afirma que las mn transformaciones EP-1 
lourman una base de L(V, W). 

Sea T una transformación lineal de V en W. Para cada j, l <j¡< mn, sean 
din -.-, Am las coordenadas del vector Ta, en la base ordenada (B”, es decir, 


E?+-(a;) 


m 
(1) Ta¡= 2 Ap¡Bp. 
p=1 
(Jueremos demostrar que 


(8-2) T= Y Y A, Er 


p=1qg”l 
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Sea U la transformación lineal del segundo miembro de (3-2). Entonces para 
cada j 


[ 
3 M "»M 
aM a M 


[ 
M 
2 
E 
la 
y 


= Ta; 


y en consecuencia U = T. Pero como (3-2) dice que los E”-* generan L(V, W) 
debemos demostrar que son independientes. Pero esto queda claro con lo ex- 
puesto anteriormente; en efecto, si la transformación 


U=>YYA,pE”" 
Pp q 
es la transformación nula, entonces Ua;,= Ú para cada j, con lo que 
2 ÁpjBp = 0 
p”l 


y la independencia de los fB, implica que 4,;= UÚ para todo p y j. | 


Teorema 6. Sean V, W y Z espacios vectoriales sobre el cuerpo F. Sea T una 
transformación lineal de V en W y U una transformación lineal de W en Z. Enton- 
ces la función compuesta UT definida por UT(a) = U(T(a)) es una transforma- 
ción lineal de V en Z. 


Demostración. 


(UT)(ca + B) = U[T (ca + 6)] 
U(cTa + TB) 
= ([U(To)] + U(TE) 


(UTA) + (UD). 


En lo que sigue debemos interesarnos principalmente en transformaciones 
lineales de un espacio vectorial en sí mismo. Como se tendrá a menudo que 
escribir «7' es una transformación lineal de V en V», se dirá más bien: «T es 
un Operador lineal sobre V». 


Definición. Si V es un espacio vectorial sobre el cuerpo F, un operador lineal 
sobre V es una transformación lineal de V en V. 


En el caso del Teorema 6, cuando V = W = Z, en que U y T son opera- 
dores lineales en el espacio V, se ve que la composición UT' es también un ope- 
rador lineal sobre V. Así, el espacio E(V, V) tiene una «multiplicación» de- 
finida por composición. En este caso el operador TU también está definido, 
y debe observarse que en general UT + TU, es decir, UT — TU + 0. Se ha 
de advertir de manera especial que si 7 es un operador lineal sobre V, entonces 
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>< puede componer 7 con 7. Se usará para ello la notación 7? = TT, y en ge- 
hernl 1%. T---T (a veces) para n= 1,2, 3, ... Se define 7? =/ si TH 0. 


Lema. Sea V un espacio vectorial sobre el cuerpo F; sean U, T, y T, opera- 
dinos lineales sobre V; sea c un elemento de F. 


(a) JU = UI =U, 
(c) «(UT,) = (cUYT, = U(cT,). 


Demostración. (a) Esta propiedad de la función identidad es obvia. Se 
la ha enunciado aquí solo para insistir. 


(b) [U(T, + TyYl(a) = ULT, + T2)(a)) 
= U(T ja + Ta) 
= U(Tia) + U(T a) 
= (UTy(a) + (UT)(a) 


TE bl P, + T,) = UT, + UT, . También 


(1, + THU ](a) = (T, + To(Ua) 
T¡(Ua) + Ta(Ua) 
= (T,U)Na) + (T:UNa) 


son lo que (7, + T7,)U = T,U + T,U. (El lector observará que las demos- 
limones de estas dos leyes distributivas no han tenido en cuenta que 7, y 
f , cri lineales, y la demostración de la segunda tampoco considera el que U es 
Ítscal.) 

(c) Se deja al lector la demostración de la parte (c). | 


ll contenido de este lema, y una parte del Teorema 5, dicen que el espacio 
veltoral L(Y, V), junto con la operación de composición, es lo que se conoce 
csmo un álgebra lineal con identidad. Se examinará esto en el Capítulo 4. 


l jemplo 8. Si A es una matriz m x n con elementos en F se tiene la trans- 
nr mación lineal 7 definida por T(X) = AX de F"*? en F”*?. Si B es una matriz 
pp m, se tiene la transformación lineal U de F”** en FP** definida por 
11) = BY. La composición UT se define fácilmente por: 


(UD) = U(T(A)) 
U(AX) 
B(AX) 
= (BAIX. 


Au UT es «multiplicación a la izquierda por el producto de matrices BA». 


Ijemplo 9. Sea F un cuerpo y V el espacio vectorial de todas las funciones 
polmomios de F en F. Sea D el operador de derivación definido en el Ejemplo 2, 
y wa 7 el operador lineal «multiplicación por x»: 


(TP) (1) = af(x). 
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Entonces DT + TD. En efecto, el lector no tendrá dificultad en verificar que 
DT — TD = 1, el operador identidad. 

Aun cuando la «multiplicación» que se tiene en L(V, V) no es conmutativa, 
está muy relacionada con las operaciones en el espacio vectorial L(V, V). 


Ejemplo 10. Sea BG = ([xa,, ..., a,) una base ordenada de un espacio 
vectorial Y. Se consideran los operadores lineales E”-* que se presentaron en 
la demostración del Teorema $5: 


E?(a;) = 0igQp. 
Estos n? operadores lineales forman una base del espacio de los operadores 
lineales sobre V. ¿Qué es E”*2E”*? Se tiene 
(Er-2E"*Ma;) = E*(8;,0,) 


= 0,E”*(a,) 
= 050, Ap. 
Luego 
r. _ JO si rxrq 
ERbr* = Er+*, si =P. 


Sea T un operador lineal sobre V. Se probó en la demostración del Teore- 
ma 5 que sl 


A, = [Ta,la 
Á = [Ar .-., An) 
entonces 
T = >, y A pg?" 
Pp q 
Si 
U=>y)B, HE" 


es Otro operador lineal en V, entonces el lema anterior dice que 
TU = a 2 AmE?DYE 2 B..E"-*) 
Pp q r 8 


=2222 An Br E? E". 
pqr os 
Como observamos, los únicos términos que quedan en esta considerable suma 
son los términos con q = r, y como E”"E"* = EP»*, se tiene 


TU =7 23 ApB,,)E”* 
paga sr 
= E Y (AB), Er». 
Pp 8 


Así el efecto de componer T' y U es el de multiplicar las matrices A y B. 

En el tratamiento de las operaciones algebraicas con transformaciones 
lineales no se ha dicho nada aún sobre inversión. Una pregunta concreta de 
interés es la siguiente. ¿Para cuáles operadores lineales 7' en el espacio V existe 
un operador lineal 77* tal que 777* = TT =M 
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Una función 7 de V en W se dice inversible si existe una función U de W en 
l tal que UT es la función identidad de V y TU es la función identidad de W. 
Yi I' es inversible, la función U es única y se representa por 7” *. (Véase Apén- 
hice.) Más aún, 7 es inversible si y, solo si, 


- 


Il, Tes inyectiva, esto es, Ta = Tff implica a = BÉ. 
2. T es sobreyectiva, esto es, la imagen de T es (coincide con) W. 


Teorema 7. Sean V y W dos espacios vectoriales sobre el cuerpo F y sea 
Í una transformación lineal de V:en W. Si T es inversible, entonces la función 
nmaproca T7* es una transformación lineal de W sobre V. 


Demostración. Volvemos a repetir para aclarar un aspecto. Cuando 7T es 
wn función inyectiva y sobreyectiva, existe una única función recíproca T”? 
que aplica W sobre V, de modo que 77 *T sea la función identidad de V, y TT”? 
wa la función identidad de W. Lo que se ha de demostrar aquí es que si una 
hunción lineal 7 es inversible, entonces la recíproca T7* también es lineal. 

Scan f, y f, dos vectores de W y sea c un escalar. Queremos demostrar que 


T"UcfB1 + B2) = cT UB, + TB. 


Sea a, = T7*f,, i¡ = 1, 2; esto es, sea a, el único vector de V, tal que Ta; = Pi. 
tomo 7 es lineal, 


T(car + a) = cToar + Tasz 
= CB, + Bo. 


Así, ca, + a, es el único vector de V que es aplicado por T en cf, + 6$,, y asi 


TXKcfB1 + B2) = car + as 
= (TB) + T Bs 


y 17* es lineal. | 


Supóngase que se tiene una transformación lineal inversible T de V sobre 
MW y una transformación lineal inversible U de W sobre Z. Entonces UT es 
inmversible y (UT) * = T7*U”?*. Esta conclusión no exige la linealidad, ni 
liinpoco implica comprobar separadamente que UT es inyectiva y sobreyectiva. 
lodo lo que se necesita es comprobar que T”*U”* es inversa a la izquierda 
e inversa a la derecha de UT. 

Si T es lineal, entonces Tía — PB) = Ta — Tf; luego Ta = Tf si y, solo si, 
oa — fB) = 0. Esto simplifica mucho la comprobación de que T' es inyectiva. 
Se dice que la transformación lineal 7 es no singular si 7y = 0 implica y = 0; 
es decir, si el espacio nulo de T es (0). Evidentemente, T' es inyectiva si y, solo 
am. T es no singular. El alcance de esta observación es que las transformaciones 
Imcales no singulares son las que preservan la independencia lineal. 


Teorema 8. Sea T una transformación lineal de V en W. Entonces T es no 
ungular si, y solo si, T aplica cada subconjunto linealmente independiente de V 
wbre un subconjunto linealmente independiente de W. 
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Demostración. Supóngase primero que 7 es no singular. Sea S un sub- 
conjunto linealmente independiente de V. Si a,, ..., q, son vectores pertene- 
cientes a S, entonces los vectores Ta,, ..., Ta, son linealmente independien- 
tes; en efecto, si 


ci(Tar) + --- + Cl Tax) = 0 


entonces 
T(cior + ++ Cx0t1) = 0 


y como T' es no singular 
cor + «+: + c10 = 0 


de lo que se sigue con que cada c, = 0, pues S es un conjunto independiente. 
Este razonamiento muestra que la imagen de S por T es independiente. 

Supóngase que T' aplica subconjuntos independientes sobre subconjuntos 
independientes. Sea a un vector no nulo de V. Entonces el conjunto S que consta 
del solo vector a es independiente. La imagen de S es el conjunto que consta 
del solo vector Ta. Por tanto, Ta + 0, pues el conjunto que consta del solo 
vector nulo es dependiente; lo que muestra que el espacio nulo de T es el sub- 
espacio cero, es decir, T es no singular. 


Ejemplo 11. Sea F un subcuerpo de los números complejos (o un cuerpo de 
característica cero) y sea V el espacio de las funciones polinomios sobre F. Consi- 
dérese el operador derivación D y el operador de la «multiplicación por x», T, 
del Ejemplo 9. Como D aplica todas las constantes sobre 0, D es singular; sin 
embargo, Y no es de dimensión finita, la imagen de D es todo V y es posible 
definir una inversa a la derecha de D. Por ejemplo, si E es el operador integra- 
ción indefinida: 


1 
n+1 


entonces E es un operador lineal en Y y DE = IT. Por otro lado, ED 4 I, pues 
ED aplica las constantes sobre 0. El operador 7' está, por así decirlo, en la si- 
tuación contraria. Si xf(x) = O para todo x, entonces f = 0. Con lo que T es 
no singular y es posible hallar una inversa a la izquierda de 7. Por ejemplo, 
si U es la operación «suprimir el término constante y dividir por x»: 





Elco + (12 + +** + Cnt”) = 0 + aa + cc. + 


CAxr+ 1 


Ulco + CL + +++ + Cat”) = (14 0204 +0 + Cpu” 
entonces U es un operador lineal en V y UT = 1. Pero TU + I, ya que cada 
función en la imagen de TU está en la imagen de 7, que es el espacio de las fun- 
ciones polinomios f tales que f(0) = 0. 


Ejemplo 12. Sea F un Cuerpo y sea 7 el operador lineal sobre F 2 definido por 


T(<,, XL) = (21 + Zo, 21). 
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lontonces 7 es no singular, pues si T(x,, x,) = O se tiene 


x1 +12 =0 
zi=0 


son lo que x, = x, = 0. También se ve que T es sobreyectiva, pues si (z,, z,) 
e cualquier vector de F?, para ver que (z,, z,) pertenece a la imagen de T se 
hom «de encontrar escalares x, y x, tales que 


1 + Te = 21 
T1 = 22 


y la solución obvia es x, = Z,, Xx, = Z1 — Z7. Este último cálculo da una fórmu- 
la explicita para 77 ?, a saber, 


TZ, Za) = (2o, 21 — 29). 


Se ha visto en el Ejemplo 11 que una transformación lineal puede ser no 
sinypular sin ser sobreyectiva y que puede ser sobreyectiva sin ser no singular. 
Il presente ejemplo ilustra un importante caso en que ello no puede suceder. 


Teorema 9. Sean V y W espacios vectoriales de dimensión finita sobre el 
wwwrpo F tal que dim V = dim W. Si T es una transformación lineal de V en W, 
his viguientes afirmaciones son equivalentes: 


(1) T es inversible. 
(11) T es no singular. 
(1) T es sobreyectiva; eso es, la imagen de T es W. 


Demostración. Sea n= dim V = dim W. Por el Teorema 2 se sabe que 
rango de (7) + nulidad (7) = n. 


Ahora bien, 7 es no singular sí, y solo si, nulidad (7) = 0, y (como n = dim W) 
la imagen de 7 es W si, y solo si, rango (7) = n. Como el rango más la nulidad 
es 1, la nulidad es O precisamente cuando el rango es n. Por tanto, T es no sin- 
pular sí, y solo si, 7(V) = W. Así, si rigen las condiciones (11) o (111), la otra se 
simple también y T es inversible. | 


Se previene al lector que no debe aplicar el Teorema 9, excepto si la dimen- 
ai es finita y con dim Y = dim W. Con las hipótesis del Teorema 9 las con- 
diciones (1), (11) y (11) son también equivalentes a éstas. 


(iv) Sifa;,..., ay es una base de V, entonces ÍTa,, ..., Ta,) es una base 
dh: VW. 

(v) Existe una base Ía;, ..., any de V tal que [Ta,, ..., Ta, y es una base 
de W. 


Se dará una demostración de la equivalencia de las cinco condiciones que 
vs diferente a la dada para la equivalencia de (1), (11) y (111). 

(1) > (11). Si 7 es inversible, T es no singular. (11) > (111). Supóngase que 
I es no singular. Sea [a,,..., a, y una base de V. Por el Teorema 8, (Tay, ..., 
l'x,! es un conjunto linealmente independiente de vectores de W, y como la 
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dimensión de W es también n, este conjunto de vectores es una base de W. Ahora 
sea $ cualquier vector de W. Existen escalares c,, ..., Cc, tales que 


B = alTa) + --- + ca(Ta,n) 
= T(cor + --> + Cr0n) 


lo que muestra que f$f pertenece a la imagen de 7. (111) — (tv). Se supone ahora 
que T es sobreyectiva. Si [x,, ..., 0, es cualquier base de V, los vectores 
Ta,, ..., To, generan la imagen de T, que es W por definición. Como la dimen- 
sión de W es n, estos n vectores deben ser linealmente independientes, esto es, 
deben constituir una base de W. (iv) — (v). Esto no requiere comentarios. 
(v) — (1). Supóngase que existe alguna base [a,, ..., a, de V tal que [a,, ..., 
Ta, y es una base de W. Como los Ta, generan W, está claro que la imagen de 
Tes todo W. Si a = c,0, + *-*: + C,0%, pertenece al espacio núlo de 7; entonces 


T(cioar + --*+ + Cran) = 0 


alTay) + -** + crl[Tan) = 0 


y como los Ta, son independientes, cada c, = 0, y así a = 0. Se ha visto que el 
recorrido de T es W, y que T es no singular, luego T' es inversible. 

El conjunto de operadores lineales inversibles sobre un espacio V con la 
«Operación de composición proporciona un buen ejemplo de lo que se conoce 
en álgebra como «grupo». Aunque no se tendrá tiempo para examinar los gru- 
pos con algún detalle, se dará al menos la definición. 


Definición. Un grupo consta de lo siguiente. 


1. Un conjunto G; 

2. Una correspondencia (u operación) que asocia a cada par de elementos 
x, y de G, un elemento xy de G de tal modo que 

(a) x(yz) = (xy)z para todo x, y, z en G (asociatividad); 

(b) existe un elemento e en G tal que ex = xe = x para todo x de G; 

(c) a cada elemento x de G le corresponde un elemento x”* en G tal que 


xx"*=x!x-e. 


Se ha visto que la composición (U, T) —> UT asocia a cada par de opera- 
dores lineales inversibles sobre un espacio V otro operador inversible sobre V. 
La composición es una operación asociativa. El operador identidad / satis- 
face IT = TI = T para todo T, y para un T' inversible existe (por el Teorema 7) 
un operador lineal inversible 77* tal que TT"* = T”*T = 1. Con lo que el 
conjunto de los operadores lineales inversibles sobre Y, junto con esta opera- 
ción, es un grupo. El conjunto de las matrices 1 x n inversibles, con la multi- 
plicación matricial como operación, es otro ejemplo de grupo. Un grupo se 
dice conmutativo si satisface la condición"xy = yx para cada x e y. Los dos 
ejemplos dados anteriormente no son, en general, grupos conmutativos. A me- 
nudo se escribe la operación en un grupo conmutativo como (x, y)—>x + y, 
en vez de (x, y) — xy, usándose entonces el símbolo 0 para el elemento «neutro» e. 
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ll conjunto de los vectores en un espacio vectorial, junto con la operación de 
mbicion vectorial, es un grupo conmutativo. Un cuerpo puede ser descrito como 
un conjunto con dos operaciones, llamadas adición y multiplicación, que es 
nh grupo conmutativo para la adición, y en que los elementos no nulos forman 
1 prupo conmutativo para la multiplicación, teniéndose, además, la ley dis- 
hibutiva x(y + 2) = xp + Xz. 


Kjercicios 


Í' Scan 7 y U operaciones lineales en R? definidas por 
T(z1, 22) = (22,131) y * U(x5 22) = (x1, 0). 


tu) ¿Cómo se describirán T y U geométricamente? 
(+) Dar reglas semejantes a las que definieron T y U para cada una de las transforma- 
chiva (1 + 7), UT, TU, T?, U?. 


Y Sea 7 el (único) operador lineal sobre C3 para el que 


Te, = (1, 0, 2), Tez = (0, 1, 1), Te = (2, 1, 0). 
¿Ya / imversible? 
Y sea 7 el operador lineal sobre R? definido por 
T(%,, Za, 23) = (31.1, 21 — T2, 2%, + 22 + 23). 
¡Ya / mversible? De serlo, hallar una expresión para T”* como aquella que define a 7. 
4 Para el operador lineal 7 del Ejercicio 3, demostrar que 
(T? = D(T — 3D) =0. 


A sea (2%? el espacio vectorial complejo de las matrices 2 x 2 de elementos comple- 


fue Seca 
l —1 
B= l-: , 


y un /' el operador lineal sobre C(?*2 definido por 7(4) = BA. ¿Cuál es el rango de T? 
, %w puede describir 7?? 


A  Sca 7 una transformación lineal de R? en R? y sea U una transformación lineal de 
H' en R?. Demostrar que la transformación UT no es inversible. Generalizar el teorema. 


$  I-ncontrar dos operadores lineales T y U en R? tales que TU =00, pero que UT E O. 


N Scan V un espacio vectorial sobre el cuerpo F y T' un operador lmeal sobre Y. Si 
1' 0, ¿qué se puede decir respecto a la relación entre la imagen de T y el espacio nulo 
'h 7” Dar un ejemplo de un operador lineal T en R? tal que 7? = 0, pero T H 0. 


Y Sta 7 un operador lineal sobre el espacio Y de dimensión finita. Supóngase que existe 
un operador lineal U en V tal que TU = 1. Demostrar que T'es inversible y que U = T”?. 
ls un ejemplo que muestre que esto es falso cuando V no es de dimensión finita. (Indicación: 
ha £ = D el operador derivación en el espacio de las funciones polinomios.) 


It), Sea A una matriz m x n con elementos en F y sea T la transformación lineal de F”*? 
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en F”*! definida por 7T(X) = AX. Hacer ver que, si m < n, puede suceder que T scu se 
breyectiva sin ser no singular. En forma semejante hacer ver que si m > n puede tomar: 
T no singular, pero no sobreyectiva. 


11. Sea V un espacio vectorial de dimensión finita y sea 7' un operador lineal sobre 
Supóngase que el rango (7*) = rango (7). Demostrar que la imagen y el espacio nulo 
T son disjuntos, es decir, tienen solo el vector nulo en común. 


12. Sean p.m y n enteros positivos y F' un cuerpo. Sean V el espacio de las matrices m x 
sobre F y W el espacio de las matrices p x n sobre F. Sea B una matriz p x m dada y 
T la transformación lineal de Y en W definida por 7(4) = BA. Demostrar que 7' es inve 
sible si, y solo si, p =m y B es una matriz m x m inversible. 


3.3. Isomorfismo 


Si V y W son espacios vectoriales sobre el cuerpo F, toda transformaci 
lineal 7 de V en W sobreyectiva e inyectiva, se dice isomorfismo de Y sobre 
Si existe un isomorfismo de Y sobre W, se dice que V es isomorfo a W. 

Obsérvese que Y es trivialmente isomorfo a V, ya que el operador identid 
es un isomorfismo de V sobre V. También si V es isomorfo a W por un isomo 
fismo 7, entonces W es isomorfo a V, pues T”* es un isomorfismo de W sob 
V. El lector podrá demostrar fácilmente que si Y es isomorfo a W y W es 1 
morfo a Z, entonces V es isomorfo a Z. En resumen, el isomorfismo es u 
relación de equivalencia sobre la clase de espacios vectoriales. Si existe un 1 
morfismo de V sobre W, se dirá a veces que V y W son isomorfos, en vez 
que V es isomorfo a W. Ello no será motivo de confusión porque Y es isomorf 
a W, sí, y solo si, W es isomorfo a Y. 


Teorema 10. Tudo espacio vectorial de dimensión n sobre el cuerpo EF 
isomorfo ul espacio F". 


Demostración. Sea V un espacio vectorial de dimensión r sobre el cue 
po F y sea BG = [x,,..., a, ) una base ordenada para V. Se define una función 
de V en F”, como sigue: Si a pertenece a V, sea Ta el n-tuple (x,, ..., Xx) 
coordenadas de a respecto de la base ordenada (KB, es decir, el n-tuple tal qu 


a = 1101 + -:>: + Z,Qn. 


En nuestro estudio sobre coordenadas en el Capítulo 2, se verificó que T e 
lineal inyectiva y aplica Y sobre F". | 





Para muchos fines es frecuente considerar los espacios vectoriales 1somor 
fos como si fueran «el mismo», aunque los vectores y las operaciones en lol 
espacios sean muy diferentes: es decir, a menudo se identifican espacios isa 
morfos. No pretendemos prolongar ahora la discusión de esta idea, sino qui 
la asimilación de la comprensión del isomorfismo y del sentido en que los es 
pacios isomorfos son «los mismos» se irá haciendo a medida que se continút 
el estudio de espacios vectoriales. 
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Mheuremos algunos breves comentarios. Supóngase que 7 es un isomorfismo 
bh) sobre H. St S es un subconjunto de Y, entonces el Teorema 8 dice que 
Y ey Iimealmente imdependiente si, y solo si, el conjunto 7(S) en W es indepen- 
dispo Así, para decidir si S es independiente no importa si se considera S o 
ida Por lo que se ve que un isomorfismo «preserva la dimensión», esto es, 
leelo subespacio de dimensión finita de V tiene la misma dimensión que su 
inspen por 7. He aquí una sencilla ilustración de esta idea. Supóngase que 
lv» ura matriz m x n sobre el cuerpo F. Ya se han dado en realidad dos de- 
in rones del espacio solución de la matriz A. La primera es el conjunto de 
hubo: los a-tuples (x,, ..., Xx,) de F” que satisfacen a cada una de las ecua- 
etenes del sistema AX = 0. La segunda es el conjunto de todas las matrices 
eslumnas 7 x 1, X, tales que AX = 0. El primer espacio solución es así un 
abi pacio F” y el segundo es un subespacio del espacio de todas las matrices 
n - | sobre F. Ahora bien, existe un isomorfismo completamente obvio entre 
ey 1, a saber, 

Ly 
(La, ..-, Tn) >] : 
Tn. 


Por este isomorfismo, el primer espacio solución de A es aplicado sobre el 
erguido espacio solución. Estos espacios tienen la misma dimensión, y así, 
el a quiere demostrar un teorema respecto a la dimensión del espacio solución, 
¡he importa qué espacio se elija para analizar. En realidad, el lector no se sor- 
prenderá sí decidimos identificar F” con el espacio de las matrices n x 1. Esto 
e h.rá cuando sea conveniente, y cuando no sea conveniente no se hará. 


Hercicios 


Y Sea Y el conjunto de los números complejos y sea F el cuerpo de los números reales. 
ami lis operaciones usuales Y es un espacio vectorial sobre F. Describir explícitamente 
"bh romorfismo de este espacio sobre R?. 


Y Sea Y un espacio vectorial sobre el cuerpo de los números complejos y supóngase que 
rante un isomorfismo 7 de V sobre C?. Sean a,, %,, 03, e, vectores en V tales que 
Toy = (1, O, 2), Tar = (—2, 1 + 2, 0), 
Tos =(-1,1,1D),  Tow= (V2,1,3). 
lu) ¿Está a, en el subespacio generado por a, y ay? 
(bh) Sca W, el subespacio generado por ax, y x, y sea W, el subespacio generado por a, 
Y +, ¿Cuál es la intersección de W, y W,? 
(u) Hallar una base del subespacio de Y generado por los cuatro vectores Q,. 
Y Sei W el conjunto de todas las matrices hermíticas 2 x 2, esto es, el conjunto de las matri- 
¿a complejas 2 x 2, A, tales que A;,= Aj; (la barra indica conjugación compleja). Como se 
e Naliba en el Ejemplo 6 del Capítulo 2, W es un espacio vectorial sobre el cuerpo de los 
binuros reales con las operaciones usuales. Verificar que 


t . 
(2,4,2,0 | +z y +3] 
Yy=ue tura 
ss un isomorfismo de R* sobre W. 
4 Demostrar que F"*" es isomorfo a F””. 


86 Alvebra lineal 


5. Sea V el conjunto de los números complejos considerados como espacio vectorial sobre 
el cuerpo de los números reales (Ejercicio 1). Se define como sigue una función T de V en, 
el espacio de las matrices reales 2 x 2. Si z = x + ¿y, con x e y números reales, entonces 


_[zx+7y  5y ] 
ro -=|o z— Ty] 


(a) Verificar que T es una transformación lineal (real) inyectiva de Y en el espacio de 
las matrices reales 2 x 2. 

(b) Verificar que T(z,z,) = T(z,)T(z,). | 

(c) ¿Cómo se describirá ia imagen de 7? | 


6. Sean V y W espacios vectoriales de dimensión finita sobre el cuerpo F. Demostrar qu 
V y W son isomorfos si, y solo si, dim Y = dim W. 


7. Sean V y W espacios vectoriales sobre el cuerpo F y sea U un isomorfismo de V sobre W, 
Demostrar que T—=UTU”?* es un isomorfismo de L(V, V) sobre L(W. W). 


3.4. Representación de transformaciones por matrices 


Sea Y un espacio vectorial de dimensión n sobre el cuerpo F, y sea W un 
espacio vectorial de dimensión m sobre F. Sea BB = [a,, ..., a, una base or- 
denada de V, y B' = [B,,..., B,ny una base ordenada de W. Si T es cualquier 
transformación lineal de Y en W, entonces T' está determinada por su efecto 
sobre los vectores a,. Cada uno de los n vectores Ta, se expresa de manera única 
como combinación lineal | 


(3-3) Ta; = 2 Abs 
de los f,. los escalares 4,;, ..., 4,,¿ son las coordenadas de Ta, en la base or- 


denada (Ó3'. Por consiguiente, la transformación T está determinada por los 
mn escalares A¡¿ mediante la expresión (3-3) La matriz m x n, A, definida 
por A(i, j) = 4;, se llama matriz de T respecto al par de bases ordenadas 6 y G'. 
La tarea inmediata es comprender claramente cómo la matriz A determina la 
transformación lineal 7. 


Siga = Xx,% +: +x,0, es un vector de V, entonces 
R 
Ta = T ( 2 2305) 
j=1 
n 
= 2 2,(Ta;) 
J=1 


j=1 q 


= 22; z AB; 


- z (2 Ayz,) Bi. 
21=1 XMy=1 


Si X es la matriz de las coordenadas de xa en la base ordenada 63, entonces el 
cálculo anterior muestra que AX' es la matriz de las coordenadas del vector /> 
en la base ordenada 4”, ya que el escalar 
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n 
2 Aj; 
j=1 
es ul elemento de la ¿ésima fila de la matriz columna AX. Obsérvese también 
gue at .f es cualquier matriz m x n sobre el cuero F, entonces 
n m n 
(141) T|> rajl= > > Az) B; 
=1 i=] j=1 


belimo una transformación lineal Y de V en W, la matriz de la cual es 4, res- 
peto a Ó3, 63", Resumiendo formalmente se tiene: 


leorema 11. Sean V un espacio vectorial de dimensión n sobre el cuerpo E, 
1 3 un espacio vectorial de dimensión m sobre F. Sean (B una base ordenada de 
ly 06 una base ordenada de W. Para cada transformación lineal T de V en W, 
vvivte una matriz m x n, A, cuyos elementos pertenecen a F, tal que 


[Ta]g; == Alala 


pura todo vector a en V. Además, T—= A es una correspondencia biyectiva entre 
vi vonjunto de todas las transformaciones lineales de V en W y el conjunto de todas 
hix matrices m x n sobre el cuerpo E. 


La matriz A, que está asociada a T en el Teorema 11, se llama la matriz de 
l respecto a las bases urdenadas (B, (B”. Obsérvese que la ecuación (3-3) dice 


que 4 es la matriz cuyas columnas A, ..., A, son dadas por 
A; = [Tajo j = l, <-.3N. 
MM (/ es otra transformación lineal de Ven W y B=|[B,,..., B,] es la matriz 


«le [' respecto a las bases ordenadas (3, (B”, entonces cA + B es la matriz de 
1 1 U respecto a B, (G'. Esto es claro porque 


CcAj + Bj; = c[Ta;le + [Ua;la: 


[Taj + Uasla: 
((cT + U)as]a,. 


Icorema 12. Sea V un espacio vectorial de dimensión n sobre el cuerpo F. 
Pia cada par de bases ordenadas GB, B' de V y W, respectivamente, la función 
y asigna a una transformación lineal T su matriz respecto a KB, B' es un iso- 
mfismo entre el espacio L(V, W) y el espacio de todas las matrices m x n sobre 
eb cuerpo E. 


Demostración. Se observó antes que tal función es lineal y, como se es- 
ibleció en el Teorema 11, esta función es inyectiva y aplica L(V, W) sobre el 
conjunto de matrices m x n. | 


listamos particularmente interesados en la representación por matrices de 
Ins transformaciones lineales de un espacio en sí mismo, es decir, de los opera- 
hores lineales sobre un espacio V. En tal caso es más conveniente usar la misma 
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base ordenada, esto es, hacer GB = GH”, y se dirá simplemente que la matriz 
que la representa es la matriz de T7' respecto a la base ordenada (6%. Como este 
concepto será muy importante para este estudio, repasaremos su definición, 
Si T es un operador linea] sobre un espacio vectorial Y de dimensión finita, 
y Bf =([a,,..., 0a,) es una base ordenada de Y, la matriz de T respecto a B (o 
la matriz de T en la base ordenada (3) es la matriz n x n. A. cuyos elementos 
A, están definidos por las ecuaciones 


(3-5) Ta; = Y Á jas, 3 = 1, .... y | 


t=1 
Se debe recordar siempre que esta matriz que representa a 7 depende de la ba 
ordenada (KB, y que existe una matriz que representa a T en cada base ordenad 
para V. (En transformaciones de un espacio en otro la matriz depende de do 
bases ordenadas, una de V y otra de W.) Para no olvidar esta dependencia 
usará la notación 


[Tla 


para la matriz del operador lineal T en la base ordenada (B. La manera cómo 
esta matriz y la base ordenada describen a T, es que para cada a de V 


[Tala = [Tlelala. 


Ejemplo 13. Sea V el espacio de las matrices columnas nr x | sobre e 
cuerpo F; sea W el espacio de las matrices m x 1 sobre F y sea A una matri 
m x n dada fija sobre F. Sea T la transformación lineal de Y en W definid 
por T(Y) = AX. Sea KB la base ordenada para V, análoga a la base canóni 
de F"; es decir, el ¡-ésimo vector de KB en la matriz n x 1, X, tienc un 1 en 1 
fila i y todos los demás elementos 0. Sea (3 la correspondiente base ordenad 
de W; o sea, el j-ésimo vector de 03” es la matriz m x 1, Y;, que tiene, un | en 
la fila y y todos los demás elementos 0. Entonces la matriz de T respecto al pa 
GB, G' es la misma matriz A. Ello es evidente, pues la matriz AX, es la ¡-ési 
columna de A. 










Ejemplo 14. Sea F un cuerpo y sea T el operador en F? definido por 
T(x1, 22) = (z,, 0). 


Es fácil ver que T es un operador lineal en F?. Sea G3 la base ordenada canó 
nica de F?*, BKB= fe,. €,). Entonces 


Te, = T(1, 0) = (1, 0) = le + Dez 
Te = T(0, 1) = (0, 0) = Oc, + Oc 


con lo que la matriz de T en la base ordenada GB es 
1 0 


Ejemplo 15. Sea V el espacio de todas las funciones polinomios de R e 
R de la forma 


f(x) = Co + Ct + car? + cga? 
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vato es, el espacio de las funciones polinomios de grado tres o menor. El opera- 
dim derivación, del Ejemplo 2, aplica Y en Y, ya que D «decrece el grado». Sea 
150 la base ordenada de Y que consta de las cuatro funciones f,, f, f3, fa de- 
litdas por f(x) = x? ?. Entonces 


(Df)() = 0, DJ, 
(DfY)= 1, Df» = 1f1 + Of2 + Of3 + Ofa 
(Dfax) = 2x, Dfs = Of. + 2f2 + Ofa + Ofa 
(Df.)(x) = 327, Df. = Of, + Of2 + 3f3 + Of 


Of. + Of. + Ofa + Ofa 


cos lo que la matriz de D en la base ordenada Gh es 
0.1050 
0.020 
De=lo 0 0 3[ 
0000 


lemos visto lo que les sucede a las matrices representantes cuando las trans- 
him.uciones se suman. y es que las matrices se suman. Cabe ahora preguntar. 
te sucede cuando se componen transformaciones. En forma más precisa, 
wn 0, W y Z espacios vectoriales sobre el cuerpo F de dimensiones n, Mm y p, 
respectivamente. Sea T una transformación lineal de Y en W y U una transfor- 
mación lineal de W en Z. Supóngase que se tienen las bases ordenadas 


B= (01, -.- , Anp, B' = (Br .--, Bm), B” = (Y... Yp) 


pu. los respectivos espacios V, W y Z. Sea A la matriz de T respecto al par 
¡1,47 y sea B la matriz de U respecto al par G3', (B”. Es fácil ver ahora que la 
mtiiz Cde la transformación UT respecto al par 6, 63” es el producto de B y A; 
vin efecto, sí x es cualquier vector de Y 

[Tala = Alala 


[U(To) la = B[T ala; 
Y 451 


(UD (a) le” = BAlale 


y hiego. por la definición y unicidad de la matriz representante, se debe tener 
que (C.= BA. Se puede también ver esto haciendo el cálculo 


(UT Mas) = U(Ta;s) 


U ( y Abs) 
k=1 


Y As(U8L) 
k=1 


m Pp 
= 2 Ax 2 Bixi 
k=1 t=1 


; Bu415) Yi 
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con lo que se debe tener 
(3-6) C ij = 2, BiA xj. 


Ya se había motivado la definición (3-6) para la multiplicación de matrices 
por operaciones sobre las filas de una matriz. Aquí se ha visto que una moti- 
vación muy convincente para la definición se tiene mediante la composición 
de transformaciones lineales. Resumiendo, tenemos: 


Teorema 13. Seam V, W y Z espacios vectoriales de dimensión finita sobre 
el cuerpo F; sea T una transformación lineal de V en W y U una transformación 
lineal de W en Z. Si B, KB' y B” son las bases ordenadas de los espacios V, W y 
Z, respectivamente, y si A es la matriz de T respecto al par KB, GB' y B es la matria 
de U respecto al par B', KB”, entonces la matriz de la composición UT respecta 
al par B, B” es la matriz producto C = BA. | 


Obsérvese que el Teorema 13 da una demostración de que la multiplicación 
de matrices es asociativa, demostración que no requiere cálculos y que es in: 
dependiente de la dada en el Capítulo 1. Debe señalarse también que en el Ejem: 
plo 12 se ha demostrado un caso particular del Teorema 13. 

Es importante hacer notar que si 7 y U son operadores lineales sobre ur 
espacio V y que si se representa por una sola base ordenada (KB, entonces el Teore 
ma 13 toma la forma simple [UT ]g = [Ulgl[71g- Asi, en este caso, la corres 
pondencia que (3 determina entre los operadores y las matrices no es solo ur 
isomorfismo del espacio vectorial, sino que también preserva los productos 
Una consecuencia inmediata de lo cual es que el operador lineal 7 es inversibl 
si, y solo si, [7] es una matriz inversible. En efecto, el operador identidad , 
está representado por la matriz identidad en cualquier base ordenada, y as 


UT = TU =I 
es equivalente a 
[UlelTle = [Tl6[Ule = 1. 
Además, cuando T es inversible 


[T-Ua = [T]6.. 


Quisiéramos ahora investigar qué sucede a la matriz representante cuand 
se cambia la base ordenada. Por razón de simplicidad se considerará solo e 
caso de operadores lineales sobre un espacio V, de modo que solo se tenga un; 
base ordenada. Se trata de lo siguiente. Sea T un operador lineal sobre el es 
pacio de dimensión finita V y sean 


B= (0, ..., An) y B' = [ai,..., an) 


dos bases ordenadas para V. ¿De qué manera están relacionadas las matrice 
[T]g y [71g:? Como se observó en el Capítulo 2, existe una matriz (inversible 
n x n, P, única tal que 


(3-7) [ola = Pla]a 
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pura cada vector aq en $. Es la matriz P= |P,, ..., P,] con P; = [a;]. Por 
Ae hiicion 


(UN) [Tale = [Tlelale. 

Aplicando (3-7) al vector Ta, tenemos 

(14 49) [Tola == P[T ala. 

tumubinando (3-7), (3-8) y (3-9) se obtiene 
[TlaPlale: = P[T ala; 


P=(TlePlale: = [Tala 


vet lo que se debe tener que 
(1 10) [Ta = PUT] aP. 


lata eos la respuesta del problema. 
Mates de enunciar este resultado queremos observar lo siguiente. Existe 
unico operador lineal U que aplica (KB sobre Bf”, definido por 


. , . 
UVa; = a), =1,...,2. 


Inte operador U es inversible, ya que aplica una base de Y sobre una base de 
| 1.1 matriz P (anteriormente citada) es precisamente la del operador U en la 
hw ordenada (B. En efecto, P está definida por 


rn 
0 = z P ijQí 
yn 


y como Ua; = aj, esta ecuación puede escribirse 
n 
Ua; = > P;jas. 
i=1 


Au P= [UJg por definición. 
Feorema 14. Sga V un espacio vectorial de dimensión finita sobre el cuerpo 
tl, v sedh 
B=i%),-..-,0) y» B=(fd,.... 0, 


dus hases ordenadus de V. Supóngase que T es un operador lineal sobre V. Si 
Po |P,, ..., P,] es la matriz n x n de columnas P;, = [9;1g. entonces 


[Tla: = P-TlaP. 


IM otra manera, si U es el operador lineal sobre V definido por Ux; = a;. j = 
LN ..., mn, entonces 


(Tle = (Ua*[TlalUle. 
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Ejemplo 16. Sea T el operador lineal sobre R? definido por T(x,, x,) = 
(x,, 0). En el Ejemplo 14 se vio que la matriz de 7 en la base ordenada canó- 


nica 6 = [e,, €,) €s 
Tio 
re =[o o) 


Supóngase que G3' es la base ordenada de R?, que consta de los vectores €; = (1, 1), 
e, = (2, 1). Entonces 

a= a+e 

ez = 2e + €2 


1 2 
P=Li 1) 
Después de un breve cálculo se obtiene 


— 1 2 
—=1 — . 
p | 1 1] 


(Ta = P-[Tl4P 
o olli 
1 


de modo que P es la matriz 


Con lo que 


, —1Jh 
= [7 JLo o! 
13 


Fácilmente se puede comprobar que esto es correcto, pues 
Ta =(10)= —a+ e 
Te = (2,0) = —2e1 + 2e2. 

Ejemplo 17. Sea V el espacio de las funciones polinomios de R en R de 
«grado» menor o igual que 3. Como en el Ejemplo 17, sea D el operador de- 
rivación en V y sea 

8 = Yu fa a, $) 


la base ordenada de V definida por f(x) = x'"*. Sea £ un número real y de- 
fínase g(x)= (x + 1) 7?, esto es, 


N=f 
Y2 = tf, + fe 
Ya = 4, + 2lf2 + f3 


ya = Bf, + 3842 + 3tf3 + fa. 


Como la matriz 


lt ¿2 

0 1.2% 30 
P=l00 1 3 

0.0 


o 1 
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eove ficilmente que es inversible con 


Lo oe —e 
pa |[0 1-2 30 
0 0 1. -—3 
0 0 0 1 


te pue que (3 = (81, 27, £3, £4) €s una base ordenada de V. En el Ejemplo 15 
mM encontró que la matriz de D en la base ordenada es 


0100 
0.0201 
De=lo 0 03 
0000 
ln matriz de D en la base ordenada (Gf' es, pues, 
l —¿ (2 (BHO 1 0 OJ[1l £ ¿md 
0 1 -—2 321|0 O 2 OO 1 2 32 
» 1 — 
PD. =l9 1 —3e lo 0 O 3llo 0 1 3 
0 0 0 1 0000100 0 1 
1 —l t? te1[0O 1 2 3 
jo 1-2  3ejjo 0 2 68 
0 0 1 —31|0 0 O 3 
0 0 0 1 00 0.0 
0100 
_|j0020 
100 0 3 
0000 


A-1 D está representada por la misma matriz en las bases ordenadas GB y GB”. 
l'w supuesto, que ello puede verse en forma directa, ya que 


Dg = 0 
Dg = Y 
Dgs = 292 
Dga = 393. 


l ste ejemplo ilustra algo importante. Si se conoce la matriz de un operador 
lmeal en cierta base (B y se desea encontrar la matriz en otra base ordenada GB", 
vs 1 menudo más conveniente efectuar el cambio de coordenadas usando la 
imiatriz inversible P; pero puede ser mucho más simple encontrar la matriz re- 
presentante por una aplicación directa de su definición. 


Definición. Sean A y B dos matrices (cuadradas) n x n sobre el cuerpo F. 
NM dice que B es semejante a A sobre F si existe una matriz inversible n x n, P, 
whre F tal que B= P"* AP. 


Dc acuerdo con el Teorema 14, se tiene lo siguiente: Si V es un espacio vec- 
terral de dimensión nr sobre el cuerpo F y KB y (KB' son dos bases ordenadas de V, 
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entonces para todo operador lineal 7 sobre V la matriz B = [T]¿g. es seme- 
Jjante a la matriz A = [7]. El razonamiento también es válido a la inversa. 
Supóngase que A y B son matrices n x n y que B es semejante a A. Sea Y cual- 
quier espacio de dimensión n sobre F y sea Ó3 una base ordenada de V. Sea T el 
operador lineal sobre Y que está representado en la base KB por 4.Si B = P7*AP, 
sea (3' la base ordenada de Y obtenida de (63 por P, es decir 


n 
oy = Y Pijas. 
¡=1 
Entonces la matriz de 7 en la base ordenada 03" será B. 

Así la afirmación de que B es semejante a A quiere decir que en cada es- 
pacio de dimensión n sobre F las matrices A y B representan la misma trans- 
formación lineal en las dos (posibles) bases ordenadas diferentes. 

Obsérvese que toda matriz ” x n, A, es semejante a sí misma, tomando 
P = I, si B es semejante a A, entonces Á es semejante a B, ya que BP = P"*AP 
implica que A = (P"*)"*BP"?*; si B es semejante a A y C es semejante a B, 
entonces C es semejante a 4, pues B= P"*'AP y C = OQ *BQO implica que 
C = (PO *A(PO). Así, pues, la semejanza es una relación de equivalencia 
en el conjunto de las matrices n x n sobre el cuerpo F. Obsérvese también que 
la única matriz semejante a la matriz identidad / es / y que la única matriz se- 
mejante a la matriz nula es la misma matriz nula. 


Ejercicios 

l. Sea T el operador lineal sobre C? definido por T(x,. x,) = (x,. 0). Sea GB la base or- 
denada canónica de C? y sea B' = fa,, a,) la base ordenada definida por x, = (l, 1), 
A» = (—¿, 2). 


(a) ¿Cuál es la matriz de T respecto al par G, 63"? 

(b) ¿Cuál es la matriz de T respecto al par GH, 63? 

(c) ¿Cuál es la matriz de T en la base ordenada 63”? 

(d) ¿Cuál es la matriz de T en la base ordenada (a,, a,!? 
2. Sea T la transformación lineal de R?* cn R? definida por 

T(z,, Ta, La) = (2, + Ta, 223 —_ 21). 

(a) Si GH es la base otdenada canónica de R? y GB' es la base ordenada canónica de R?. 
¿cuál es la matriz de T respecto al par BH, GB"? 

(b) Si BG = fa,, a,., az) y KB = [B,, fP,!, donde 

a = (1, 0, —1), ar = (1, 11D, as = (1, O, 0), Br = (0, 1, B2 = (1, 0) 

¿Cuál es la matriz de T respecto al par GB, GB”? 
3. Sea T un operador lineal sobre F”, sea A la matriz de T en la base ordenada canónica 


para F” y sea W el subespacio de F” generado por los vectores columna de A. ¿Qué rela- 
ción existe entre W y T? 


4. Sea V' un espacio vectorial bidimensional sobre el cuerpo F y sea 63 una base ordenada 
de V. Si T es un operador lineal en Y y 

a b 

Tla = 

[(Tle : d 


demostrar que 7? — (a + d)T + (ad — be = 0. 
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A Sea 1 el operador lmeal sobre R? cuya matriz en la base canónica es 


1201 
ÁA = 0 1 1| 
=-1 34 


lhinontra una base de la imagen de T y una base del espacio nulo de 7. 
A sea [ el operador lineal sobre R? definido por 
T(x1, 12) = (—2a, %1). 
(1) ¿Cuál es la matriz de T en la base ordenada canónica de R?? 
(bh) ¿Cuál es la matriz de T en la base ordenada (6 = fa,, %,), donde ax, = (1, 2) y 
. (1 —1)? 
(«) Demostrar que para cada número real c el operador (T — cf) es inversible. 


01) Demostrar que si Ó3 es cualquier base ordenada para R? y [T]g = A. entonces 
ll, 1, +0. 


Y Sca T el operador lineal en R* definido por 
T(x,, 2, T3) = (3z, + L3, — 2x1 + 2, — Xi + 22 + 4x3). 


ti) ¿Cuál es la matriz de T en la base ordenada canónica de R?? 
(bh) ¿Cuál es la matriz de T en la base ordenada 


(01, 0%, 03) 


home 21 = (tl, O, l). XA = (—-1, 2, 1) y %3 = (2. Il, 1)? 
(«) Demostrar que T es inversible y dar una expresión de T”* tal como la que de- 
hito a 7. 


NX  Sca f un número real. Demostrar que las dos matrices siguientes son similares sobre 
ab unerpo de los números complejos: 


cosé  —sen A 5 0 
sen 6 cos O 0 e€*% 


¡Mierencia: Sea T el operador lineal sobre C'? representado por la primera matriz en la 
hare ordenada canónica. Encontrar entonces vectores x, y a, tales que Ta, = cla,, Ta, = 
r 'X, Y (2%. 2%, Sea una base.) 


Y  Sca Y un espacio vectorial de dimensión finita sobre el cuerpo F y sean S y T opera- 
deres lineales sobre Y. Se pregunta: ¿cuándo existen dos bases ordenadas 6G3 y GB de V 
tiles que [S |, g = [7] g:? Demostrar que tales bases existen si. y solo si, existe un ope- 
vidor lineal inversible U en 1 tal que T = USU '. (Esquema de la demostración: Si [S]g = 
| / |, - sea U el operador que aplica (63 sobre 63" y demostrar que S = UTU”?. Recípro- 
v.amenic, sí YT = USU * para algún U inversible, sea 063 cualquier base ordenada para 
ly sca 03" su imagen por U. Demostrar entonces que [S]¿ = [7 ]g..) 


10. Se sabe que el operador lineal T sobre R? definido por T(x,. x2) = (x,, U) está repre- 
sentado, en la base ordenada canónica, por la matriz 


1.0 
a=|, o] 


l ste operador cumple 7? = /. Demostrar que si S es un operador lincal sobre R? tal que 
y” = S, entonces S = 0,0 S = Jo existe una base ordenada (3 de R” tal que [S]g = A 
(interiormente). 
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11. Sea W el espacio de todas las matrices columna n x | sobre el cuerpo F. Si A es una 
matriz n x n sobre F, entonces A define un operador lineal £, sobre W por la multiplica- 
ción a la izquierda L,(X) = AX. Demostrar que cada operador lineal sobre W es el pro- 
ducto a la izquierda de alguna matriz n x n; es decir, es L, para algún A. 

Ahora supóngase que V es un espacio vectorial de dimensión n sobre el cuerpo F y que 
(B es una base ordenada de V. Para cada a de V se define Ua = [a]. Demostrar que U es 
un isomorfismo de Y sobre W. Si T es un operador lineal sobre Y, entonces UTU”! es un 
operador lineal sobre W. Por tanto, UTU”! es el producto a la izquierda por alguna matriz 
n xn, A. ¿Cuál es 4? 


12. Sea V un espacio vectorial de dimensión n sobre el cuerpo F y sea BH = [2,,..., %,) 
una base ordenada de Y. 
(a) Conforme al Teorema 1 existe un operador lineal único 7 sobre V tal que 


¿Cuál es la matriz 4 de T en la base ordenada (HB? 

(b) Demostrar que 7" = 0, pero que 7"7' 40. 

(c) Sea S cualquier operador lineal en Y tal que S” = 0, pero con $””* 4 0. Demos 
trar que existe una base ordenada (B' de V tal que la matriz de S en la base ordenada 3" 
es la matriz A de la ¡rte (a). 

(d) Demostrar que si M y N son matrices n x n sobre F tales que M” = N” = 0, a 


Ta; = 054, =1,...,n—1, Ton = 0. 


M" 12024 N""?. entonces M y N son semejantes. 


13. Sean V y W espacios vectoriales de dimensión finita sobre el cuerpo F' y sea T una 
transformación lineal de V en W. Si 


B= (01,.--,0nj) Y B'=4B-..,Bnj 


son bases ordenadas de V y W, respectivamente, definase la transformación lineal E?» 
como en la demostración del Teorema 5: E*P-*(0,) = 9,,P,. Entonces, los EP, | < p < m, 
l < q < n, forman una base de L(l”, W), y asi 





m Tr 
T= Y Y ApnEr" 
p=1q=1 
para ciertos escalares A, , (las coordenadas de T' en esta base de L(V, W). Demostrar que 
la matriz A con elementos A(p, q) = A,, es justamente la matriz de T respecto al par (3, 03". 


3.5. Funcionales lineales 


Si Y es un espacio vectorial sobre el cuerpo F, una transformación lineal 
f de V en el cuerpo de escalares F se llama también un funcional lineal sobre Y. 
Si se comienza desde el principio, esto quiere decir que f es una función de 
V en F, tal que 


f(ca + B) = cfla) + $(6) 


para todos los vectores a y fí de V y todos los escalares « de F. El concepto de 
funcional lineal es importante para el estudio de los espacios vectoriales de 
dimensión finita. pues ayuda a organizar y clarificar el estudio de los subes- 
pacios, las ecuaciones lineales y las coordenadas. 
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Ejemplo 18. Sca F un cuerpo y sean a4,, ..., a, escalares pertenecientes 

w / Definasec una función f en F"” por 
ft, ..., Tn) = 11 + +** + 0,Tp. 
I mtences f es un funcional lineal sobre F”. Es el funcional lineal representado 
pur la matriz [a,, ..., a,] respecto a la base ordenada canónica de F” y la base 
jode F: 
a; = f(e), =1,...,2. 

lodo funcional lineal sobre F” es de esta forma para ciertos escalares a,,..., a. 


I llo se sigue de la definición de funcional lineal, ya que definimos a, = fle;) 
y empleando la linealidad 


fr... , tn) =$ 6 2) 
= 2 Tifles) 
= 2 0,%j. 
l jemplo 19. He aquí un ejemplo importante de un funcional lineal. Sea 


nun entero positivo y F un cuerpo. S1 A es una matriz n x n con elementos 
en F, la traza de A es el escalar 


trA = An + A+ ++: + Ánn. 


ly tunción traza es un funcional lineal en el espacio de las matrices F”"*”, pues 


z (CA s + B;;) 


tr (CA + B) 


C y As + z Bs; 
i=1 > 


= ctr A + tr B. 


lljemplo 20. Sea V el espacio de todas las funciones polinomios del cuer- 
po ¿en sí mismo. Sea f un elemento de F. Si se define 


L¡(p) = ptt) 


entonces £, es un funcional lineal en Y. Es usual describir esto diciendo que, 
pata cada £, la «valuación en f» es un funcional lineal en el espacio de las fun- 
ciones polinomios. Habría que advertir que el que las funciones sean polino- 
mios no interviene en el ejemplo. La valuación en f es un funcional lineal en el 
espacio de todas las funciones de F en F. 


l:jemplo 21. Este puede ser el funcional lineal más importante en mate- 
watica, Sea [a, b] un intervalo cerrado del eje real y sea C([a, b]) el espacio de 
las funciones reales continuas sobre [a, b]. Entonces 


L() = [90 at 


denme un funcional lineal £L en C([a, b]). 
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Si V es un espacio vectorial, el conjunto de todos los funcionales lineales 
sobre Y forman, naturalmente, un espacio vectorial. Es el espacio L(V, F). 
Se designa este espacio por V* y se le llama espacio dual del Y: 


y* = L(V, F). 


Si V es de dimensión finita se puede obtener una descripción muy explícita 
del espacio dual V*. Por el Teorema 5 sabemos algo acerca del espacio V*: 


dim V* = dim V. 


Sea 03 = [a,,..., a,y una base de Y. Conforme al Teorema 1 existe (para cada ¡) 
un funcional lineal único f, en V tal que 


(3-11) f:(a;) = Ósj. 
De esta forma se obtiene de (KB un conjunto de n funcionales lineales distintos 


fi...» fi sobre V. Estos funcionales son también linealmente independientes, 
pues supóngase que 


(3-12) f = z Ccif;. 
Entonces 
fla) = 3 ofda) 


n 

= 2 Ci0;j 
i=1 

= Cj. 


En particular, si f es el funcional cero. f(a;) = O para cada j y, por tanto, los 


escalares c, son todos ceros. Entonces los f,, ..., f, son n funcionales lineal- 
mente independientes, y como se sabe que V* tiene dimensión n, deben ser 
tales que B* =[f,, ..., f,) es una base de V*. Esta base se llama base 
dual de Gh. 

Teorema 15. Sea Y un espacio vectorial de dimensión finita sobre el cuer- 
po F y sea BB = [9,,..., 0, una base de V. Entonces existe una única base dual 


B*= fo... Jay de V* tal que fa) = 8,,. Para cada funcional lineal fsobre 
V se tiene 


(3-13) f = 2 Ha) 

y para cada vector a de V se tiene 

(3-14) a= 2 fla)a;. 
¡=1 


Demostración. Se ha visto antes que existe una base única que es «dual» 
de BH. Si f es un funcional lineal sobre V, entonces f es una combinación lineal 
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(1.12) de los f y, como observamos después de (3-12), los escalares c; vienen 
duidos por c, = f(a;). En forma análoga, sl 


n 
a= 2 Tio; 
¡=1 


e, un vector de Y. entonces 


fi(a) = 2 2:f,(as) 


= Y Ci; 


5.1 


de modo que la expresión única para a, como combinación lineal de los a,, es 
n 
a = E fiaJas. i 
qn 


l a ecuación (3-14) suministra un buen modo de describir qué es la base 
ual Dice que, si (6 = f0,, ..., 0a,) es una base ordenada de V y 
0 = [f. .-.. fh es la base dual, entonces f;, es precisamente la función que 
asigna a cada vector x en V la ¡-ésima coordenada de a respecto a la base orde- 
mada (63, Así que también se pueden llamar los f, funciones coordenadas de (GB. 
| y fórmula (3-13), cuando se combina con (3-14), «lice que: Si f pertenece a 
)* y sí f(2,) = a;, entonces si 

a = 1101 + --* + Zr0n 
w tiene 


() 15) fla) = QT +... + UAnTn. 


ln otras palabras, si se elige una base ordenada (B de Y y se expresa cada vec- 
tor en Y por su n-tuple de coordenadas (x,, .... x,) respecto a (3, entonces 
vda funcional lineal en V tiene la forma (3-15). Esta es la generalización natu- 
111 del Ejemplo 18, que es el caso especial en que Y = F" y B =([e€,,..., €). 


ljemplo 22. Sea V el espacio vectorial de todas las funciones polinomios 
de R en R que tienen grado menor o igual que 2. Sean f,, £,, tf, tres números 
reales distintos arbitrarios, y sea 
L:(p) = plt,). 


lntonces £,. £, y Ly son funcionales lineales sobre Y. Estos funcionales son 
Imcalmente independientes; en efecto, supóngase que 


L = al, + CaLs + csLa. 


Si 1 = 0; es decir, si L(p) = O para todo p de V, entonces aplicando L a las 
«lunciones» polinomios particulares 1, x, x?, tenemos 


a+ca+c=0 
lCi + toca + taca = O 
lic + cs + ca = 0 
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De aquí se sigue que Cc, = Cc, = (3 = 0, porque (como lo indica un ligero cálcu- 
lo) la matriz 


1.1 1 
151 ta ta 
6 E 6 


es inversible cuando f,, t, y f¿ son distintos. Entonces los L, son independien- 
tes, y como Y tiene dimensión 3, estos funcionales forman una base de V*, 
¿Cuál es la base de V de la que ésta es la dual? Tal base [p,, p,, p3) de V debe 
satisfacer 


L:(pj) = 6s; 


pilti) = ds; 
Estas funciones polinomios son, como se ve bien fácilmente, 


_ (x — taxa — ta) 
pil) = (t, — to) (1 — ta) 


_(x — ti) (xr — ta) 
PIO eN — ha) 


_ (xx — tia — to) 
pz) = Y — do) 


La base [p,, p>, p3) para V es interesante, ya que de acuerdo con (3-14) se tiene 
para cada p en V 


p = plti)p. + plt2)p: + p(ta)pa. Ñ 


Con lo que, si c,, c, y cz son números reales cualesquiera, existe exactamente 
una función polinomio p sobre R que tiene grado a lo más 2 y satisface a p(t;) =C;j, 
j= 1,2, 3. Esta función polinomio es p = C¡p, + CP + C3P3. 

Sea estudiar ahora la relación entre los funcionales lineales y los subespa- 
cios. S1 f es un funcional lineal no nulo, entonces el rango de f es 1, ya que la 
imagen de f es un subespacio no nulo del cuerpo escalar y debe ser (por tanto) 
el cuerpo escalar. Si el espacio de referencia V es de dimensión finita, el rango 
más la nulidad (Teorema 2) nos dice que el espacio nulo N, tiene dimensión 
En un espacio vectorial de dimensión n, un subespacio de dimensión n — 1 
se llama un hiperespacio. Tales espacios se llaman también a veces hiperplanos 
o subespacios de codimensión 1. ¿Es todo hiperespacio el espacio nulo de un 
funcional lineal? Se ve fácilmente que la respuesta es sí. No es mucho más difí- 
cil demostrar que todo subespacio de dimensión d es la intersección de los es- 
pacios nulos de (n — d) funciones lineales (Teorema 16, más adelante). 


Definición. Si V es un espacio vectorial sobre el cuerpo F y S es un subconjun- 
to de V, el anulador de S es el conjunto S* de funcionales lineales f sobre V tales 
que fla) = Ú para todo a de S. 


Pransformaciones lmeales 10! 


Debería ser claro para el lector que S% es un subespacio de V*, sea o no 
S un subespacio de V. Si S es el conjunto que consta del solo vector cero, en- 
tonces S% = YV*, Si S = Y, entonces S% es el subespacio cero de V*. (Esto es 
liicil de ver cuando Y es de dimensión finita.) 


Teorema 16. Sea V un espacio vectorial de dimensión finita sobre el cuer- 
po F y sea W un subespacio de V. Entonces 


dim W + dim W? = dim V. 


Demostración. Sea k la dimensión de W y fa,, ..., aj) una base de W. 
Se eligen vectores 0%; + , ..., %, €n V, de modo que (a; ..., %,j sea una base para V. 
Sea (fi, ---> faj la base de V* que es dual de esta base de V. Se afirma que 
Ulhris - > - > fa) es una base del anulador W?. Efectivamente, f; pertenece a WO 
para ¿> k + 1, ya que 


f ¡(as) = 0, 


y0¡=0sii>k+w+1y]j< k; de esto se sigue que, para ¡ > k + 1, fia) = O 
siempre que a sea una combinación lineal de %,,....,a,. Los funcionales f.+1,..., 
f, son independientes, de modo que todo lo que se debe demostrar es que ge- 
neran W%, Supóngase que f está en V*. Entonces 


f= 200, 
de modo que si f está en W? se tiene f(a,) = 0 para ¿<k y 
f= 3 Nadfe 
1=k+1 


Hemos mostrado que si dim W = k y dim V = n, entonces dim W?% = 
n=k. 


Corolario. Si W es un subespacio de dimensión k de un espacio vectorial 
l de dimensión n, entonces W es la intersección de (rr — k) hiperespacios en V. 


Demostración. Este es un corolario de la demostración del Teorema 16 
miis bien que su enunciado. Con la nomenclatura de la demostración, W es 
justamente el conjunto de los vectores a tales que fla) =0,¿=k +1, ...,n. 
lin caso de que k =m-— 1, W es el espacio nulo de f,. | 


Corolario. Si W, y W, son subespacios de un espacio vectorial de dimen- 
uón finita, entonces W, = W, si, y solo si, Wi = W?. 


Demostración. Si W, = W,, entonces es claro que W? = W?.Si W, + W,, 
entonces uno de los dos subespacios contiene un vector que no está en el otro. 
Supóngase que hay un vector a que está en W,, pero no en W,. Por el corola- 
rio anterior (o por la demostración del Teorema 16), existe un funciónal lineal 
/ tal que f(PB) = O para todo f de W,, pero fía) + O. Entonces f está en W?, 
pero no en W? y UI + W. | 
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En la sección siguiente se darán demostraciones distintas para estos dos 
corolarios. El primer corolario dice que, si se elige una base ordenada del es- 
pacio, cada subespacio de dimensión k puede describirse dando (n — k) con- 
diciones lineales homogéneas para las coordenadas respecto de esa base. 

Obsérvese, ahora, el sistema de ecuaciones lineales homogéneas desde el 
punto de vista de los funcionales lineales. Supóngase que se tiene un sistema 
lineal de ecuaciones 

Ánti + +*: + Ámtn =0 


Amt + ne? + Amat = 0 


del que se quiere encontrar sus soluciones. Si se designa por f..¡=1,...,m 
al funcional lineal en F” definido por 


fi(x,, e... 7) Tn) = At + ..” + A inTn 
entonces se busca el subespacio de F” para todos los x tales que 
fila) = 0, ¿=1,...,m. 


En otras palabras, se busca el subespacio anulado por f,. .... f.,. La reduc- 
ción por filas de la matriz de los coeficientes da un método sistemático para 
encontrar este subespacio. El n-tuple (4;,, ..., An) da las coordenadas del 
funcional lineal f, respecto a la base que es dual a la base canónica de F”. El 
espacio de las filas de la matriz de los coeficientes puede. pues. considerarse 
como el espacio de los funcionales lineales generado por f;..... f,,- El espacio 
solución es el subespacio anulado por este espacio de funcionales. 

Ahora se puede considerar el sistema de ecuaciones desde el punto de vista 
«dual». Esto es, supóngase que se den m vectores de FF” 


os = (Am ---> Á in) 
y que se desea hallar el anulador del subespacio generado por estos vectores. 


Como un funcional lineal típico sobre F” tiene la forma 


flI1, --., Tn) = CU + ++ + Crta 
la condición de que f esté en este anulador es que 


Y Asc =0, ¿=1,...,m 
j=1 


esto es, que (C,..... c,) sea una solución del sistema AY = 0. Desde este punto 
de vista. la reducción por filas da un método sistemático para hallar el anula- 
dor del subespacio generado por un conjunto finito de vectores de F"”. 


Ejemplo 23. He aquí tres funcionales lineales sobre R?: 


fi(x,, T2, La, 24) = 21 + 222 + 2x3 + Za 
JAT1, Ta, Lg, 24) = Z22 + 24 
fa(X1, To, Ta, Ta) = — 2x1 = 473 + 3TA. 
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ll subespacio que anulan puede ser encontrado explícitamente hallando la 
matriz escalón reducida por filas de la matriz 


1 2 2 1 
A = o 2 0 1|4 
=2 0 -—4 3 


Um cálculo breve, o una observación del Ejemplo 21 del Capítulo 2, muestra que 


1020 
R=|0 1 0 0) 
0001 
Por tanto, los funcionales lineales 


gi(T1, To, Ta, L4) = 21 + 223 
ga(tr, X2, Ta, Ta) = a 
Qa(L1, La, La, Ta) = Ta 


peneran el mismo subespacio de (R*)* y anulan el mismo subespacio de R* 
como lo hacen f,, f,, f3. El subespacio anulado consta de los vectores con 
zx, = —22 
XT = Ly = O. 
Ejemplo 24. Sea W el subespacio de R? generado por los vectores 
1 = (2, —2,3, 4, —1), a = (0, 0, —1, —2, 3) 
az = (—1, 1, 2, 5, 2), om = (1, —1, 2, 3, 0). 
¿Cómo se puede describir W*, anulador de W? Formando la matriz 4 x 5, A, 


con vectores filas %,, %,, %z, %,, y Se encuentra la matriz escalón reducida por 
lilas R que es equivalente por filas a .4: 


2 -2 3 4 —1 1 -10 -—-1 0 
—1 1 2 5 2 0 O 1 2 0 
á=l o o -1-2 31 "”"lo oo ol 
1 —1 2 3 0 0 0 0 0 0 
Si f es un funcional lineal sobre R?: 
5 
J(T1, - - ., To) = 2 Cit; 
ja 


entonces f está en W? si, y solo si, f(a¿) = 0, ¿ = 1, 2, 3, 4; es decir, si, y solo si, 
2 Aso = 0, 1<7<4, 
listo es equivalente a 
Y Rie =0,  1<i<3 
j=l 
Cc — (—4=0 


c3 + 2c4 = 0 
Cs = 0. 
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Todos estos funcionales lineales f se obtienen asignando valores arbitrarios 
a €, y Ca, por ejemplo, c, = a y Cc, = b, y a continuación hallando los corres- 
pondientes Cc, = a + b, c3 = —2b, cs = 0. 

Con lo que W?% consta de los funcionales lineales f de la forma 


f (X1, La, La, La, T5) = (a + b)x, + quí — 2bx3 + DXs. 


La dimensión de W? es 2, y una base [f,, f,) para W* puede encontrarse pri- 
meramente tomando a = 1, b=0, y entonces a= 0, b= 1: 


Íi(T1, ..., To) = Tr + Za 
faAlt1,...,25) = Li — Zt3 + Za. 


El f anterior general en WY es f = af, + bf. 


Ejercicios 
l. En R?, sea a, =(1,0,1), 0, =(0, 1, -2) a, =(-1, —1, 0) 
(a) Si f es un funcional lineal sobre R3 tal que 


foa)=1, faj=-—1, — fa) =3, 
y si a = (a, b, c), hallar f(a). 
(b) Describir explícitamente un funcional lineal f sobre R*? tal que 


fla.) = fías) =0 pero fas) 0. 
(c) Sea f cualquier funcional lineal tal que 


fla) =fl0) =0 y fas) 0. 
Si a = (2, 3, —1), demostrar que f(a) 4 0. 
2. Sea B = [fa,, 97, ,) la base para C? definida por 
o = (1,0, —1), o = (1,1, 1), oz = (2, 2, 0). 
Hallar la base dual de GB. 


3. SiA y Bson matrices n x n sobre el cuerpo F, demostrar que traza (4B) = traza (BA). 
Entonces demostrar que las matrices semejantes tienen la misma traza. 


4. Sea V el espacio vectorial de todas las funciones polinomios p de R en R que tienen 
grado 2 o menor: 


p(z) = (o + uz + caz?. 


Se definen tres funciones lineales sobre Y por 
1 2 -1 
no) = ena, 0 fra, 1 = [ra ar. 


Demostrar que (f,, f2, f3) es una base de V*, presentando la base de Y de la cual ésta 
es dual. 


S. Si A y B son matrices complejas n x n, hacer ver que es imposible que AB — BA = I. 
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O. Scan m y n enteros positivos y F un cuerpo. Sean f,,..., f,, funcionales lineales en F”. 
Para a cn F" se define 


Ta = (fila), . . . ,Jm(a)). 


Demostrar que T es una transformación lineal de F” en F”. Demostrar luego que toda 
transformación lineal de F” en F"” es de la forma anterior para ciertos f,, ..., fm- 


7. Sea a, = (1, 0, —1, 2) y a, = (2, 3, 1, 1) y sea W el subespacio de R* generado por 
x, y QA. ¿Qué funcionales lineales f: 


Í(T1, To, Ta, Ta) = C1T1 + C22 + Cala + Cata 
están en el anulador de W? 
8. Sea W el subespacio de R? generado por los vectores 


a =e€+2e+€  0=e+ 36 + 344 € 
0 = € + 462 + 66 4 464 + €s. 
Hallar una base de W?. 
9. Sea V el espacio vectorial de todas las matrices 2 x 2 sobre el cuerpo de los números 


reales, y sea 
2 —2 
B=|_; :) 


Sea W el subespacio de Y que consta de todas las A tales que 4B = 0. Sea f un funcional 
lineal sobre Y que está en el anulador de W. Supóngase que f(/) = 0 y f(C) = 3, donde 
I cs la matriz identidad 2 x 2 y 
0 0 
c=L0 1) 


10. Sea F un subcuerpo de los números complejos. Se definen r» funcionales lineales en 
F" (n > 2) por 


Hallar f(B). 


fdiw 7) = 3 (69  1<k<n 
pe 


¿Cuál es la dimensión del subespacio anulado por f,, ..., f,? 


ll. Sean W, y W, subespacios de un espacio vectorial Y de dimensión finita. 
(a) Demostrar que (W, + W,Y = W¿ MN W?. 
(b) Demostrar que (W, (1) W,Y? = WI + W?. 


12. Sea V un espacio vectorial de dimensión finita sobre el cuerpo F y sea W un subespa- 
cio de V. Si f es un funcional lineal sobre W, demostrar que existe un funcional lineal g 
sobre V tal que g(a) = fla) para todo a del subespacio W. 


13. Sea F un subcuerpo del cuerpo de los números complejos y sea Y cualquier espacio 
vectorial sobre F. Supóngase que f y g son funcionales lineales sobre V tales que la función 
h definida por ha) = f(a)de(a) sea también un funcional lineal sobre Y. Demostrar que 
f=00g=0. 


14. Sea F un cuerpo de característica cero y sea V un espacio vectorial de dimensión finita 
sobre F. Si %,,..., %,, son un número finito de vectores de V, distintos del vector nulo, de- 
mostrar que existe un funcional lineal f sobre V tal que 


fla)r0,  ¿=1...,m 
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15. De acuerdo con el Ejercicio 3, las matrices semejantes tienen la misma traza. Entonces 
se puede definir la traza de un Operador lineal en un espacio de dimensión finita como la 
traza de cualquier matriz que represente al operador en una base ordenada. Esta está bien 
definida, ya que todas las matrices que representan un operador son semejantes. 

Sea ahora Y el espacio de todas las matrices 2 x 2 sobre el cuerpo F y sea P una matriz 
2 x 2 dada. Sea T el operador lineal sobre Y definido por 7(4) = PA. Demostrar que 
traza (T) = 2 traza (P). 


16. Demostrar que el funcional traza de una matriz n x n es único en el siguiente sentido. 
Si W es el espacio de las matrices n x n sobre el cuerpo F y si f es un funcional lineal sobre 
W tal que F(AB) = F(BA) para todo A y B de W, entonces f es un múltiplo escalar de la 
función traza. Si además f(7) = n, entonces f es la función traza. 


17. Sea W el espacio de las matrices n x n sobre el cuerpo F' y sea W, el subespacio ge- 
nerado por las matrices C de la forma C = AB — BA. Demostrar que W, es exactamente 
el subespacio de las matrices que tienen traza cero. (Indicación: ¿Cuál es la dimensión del 
espacio de las matrices de traza cero? Considerar las matrices «básicas», es decir, las ma- 
trices que tienen solo un elemento no nulo, para construir suficientes matrices linealmente 
independientes de la forma AB — BA.) 


3.6. El doble dual 


Una pregunta respecto a bases duales que no se contestó en la sección an- 
terior, era si toda base de V* es la dual de alguna base de V. Una posibilidad 
de contestar esta pregunta es considerar V**, espacio dual de V*. 

Si a es un vector de V, entonces a: induce un funcional lineal L, sobre V*, 
definido por 


Laf) =fla),  f en V*. 


El hecho de que L, sea lineal no es más que una reformulación de la definición 
de las operaciones lineales en V*: 


La(cf + y) = (ef + gía) 
(cf (a) + g(a) 
cfla) + gla) 
cLa(f) + Lalg). 


Si V es de dimensión finita y a + 0, entonces L, + 0; en otras palabras, existe 
un funcional lineal f tal que f(a) + O. La demostración es muy simple y fue 
dada en la Sección 3.5: Elíjase una base ordenada (HB = ([a,, ..., a,) de V tal 
que a, = a, y sea f el funcional lineal que asigna a cada vector en Y su primera 
coordenada en la base ordenada (B. 


Teorema 17. Sea Y un espacio vectorial de dimensión finita sobre el cuer- 
po E. Para cada vector a de V se define 


LIA = fa),  f en V?. 


La aplicación a => L, es entonces un isomorfismo de V sobre V**, 
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Demostración. Hemos mostrado que para todo a la función £, es lineal. 
Supongase que a y fí pertenezcan a V y ca F, y sea y = ca + f. Entonces para 
cada fen V* 


LAA = Fr) 
= f(ca + $6) 
= Cf(a) + $(8) 
Y asi = af) + LAf) 
Ñ L, = cLa + Lg. 


sto muestra que la aplicación a —> L, es una transformación lineal de V en 
y **. Esta transformación es no singular; en efecto, de acuerdo con las obser- 
viciones anteriores L, = 0 si, y solo si, a = 0. Entonces a — £, es una trans- 
tormación lineal no singular de Y en V**, y como 


dim V** = dim V* = dim V 


cl Teorema 9 afirma que esta transformación es inversible .y es, por tanto, un 
inomorfismo de V sobre V**. | 


Corolario. Sea V un espacio vectorial de dimensión finita sobre el cuerpo F. 
Si L es un funcional lineal en el espacio dual V* de V, entonces existe un único 
vector a de V tal que 


LN = fla) 
para todo f de V?*. 


Corolario. Sea V un espacio vectorial de dimensión finita sobre el cuer- 
po F. Toda base de V* es dual de alguna base de V. 


Demostración. Sea (B* = [f,,..., f,) una base de V*. Por el Teorema 15, 
existe una base (£L,, ..., £,) de W** tal que 


L4f5) = 05. 
Por el corolario anterior, para todo ¡ existe un vector a, de V tal que 
LA) = f(as) 


para todo f de V*; es decir, tal que £; = La,. Se sigue inmediatamente que 
'%, ---, %,) es una base de V y que 03* es la dual de esta base. | 


En vista del Teorema 17 es corriente identificar a con £L, y decir que V «es» 
cl espacio dual del V*, o que los espacios V, V* están naturalmente en mutua 
dualidad. Cada uno es el espacio dual del otro. En el último corolario se tiene 
una ilustración de lo útil que esto púede ser. He aquí otra ilustración. 

Si E es un subconjunto de V*, entonces el anulador E” es (técnicamente) 
un subconjunto de V**. Si se decide identificar V y V** como en el Teorema 17, 
entonces E% es un subespacio de V, vale decir el conjunto de todos los a de Y 
tales que f(a) = O para todos los f de E. En un corolario del Teorema 16 hemos 
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observado que cada subespacio W está determinado por su anulador W%. ¿Cómo 
está determinado? La respuesta es que W es el subespacio anulado por todos 
los f de W?; esto es, la intersección de los espacios nulos de todos los f en W?*, 
Con nuestra actual nomenclatura para anuladores, la respuesta puede escri- 
birse en forma muy simple: W = (M9). 


Teorema 18. Si S es cualquier subconjunto de un espacio vectorial de di- 
mensión finita V, entonces 1S%)% es el subespacio generado por S. 


Demostración. Sea W el subespacio generado por S. Es claro que W? = S?, 
Por tanto, lo que se debe demostrar es que W = W%. Ya se ha dado una de- 
mostración. He aquí otra. Por el Teorema 16 


dim W + dim WY = dim V 
dim WY + dim WOW = dim V* 


y como dim Y = dim V*, se tiene 
dim W = dim WO", 
Como W es un subespacio de M%%, se ve que W = W*%, | 


Los resultados de esta sección son válidos para espacios vectoriales arbi- 
trarios; sin embargo, las demostraciones requieren el uso del llamado axioma 
de elección. Queremos evitar enredarnos en una larga discusión de ese axioma, 
de modo que no se abordarán los anuladores en espacios vectoriales generales. 
Pero hay dos resultados respecto a funcionales lineales en espacios vectoriales 
arbitrarios, tan fundamentales, que se daran a continuación. 

Sea V un espacio vectorial. Queremos definir hiperespacios en V. A menos 
que Y sea de dimensión finita, no se puede hacer eso considerando la dimensión 
del hiperespacio. Pero se puede expresar la idea de que un espacio N tiene apenas 
una dimensión menos que V, de la siguiente forma: 


l. Nes un subespacio propio de V; 
2. si W es un subespacio de Y que contiene a ÑN, entonces W= N o 
W =V,. 


Las condiciones (1) y (2) en conjunto dicen que N es un subespacio propio y 
que no existe un subespacio propio mayor; vale decir, N es un subespacio pro- 
pio maximal. 


Definición. Si V es un espacio vectorial, un hiperespacio en V es un subes- 
pacio propio maximal de V. 


Teorema 19. Si f es un funcional lineal 10 nulo sobre el espacio vectorial V, 
entonces el espacio nulo de f es un hiperespacio en V. Reciprocamente, todo hi- 
perespacio de V es el espacio nulo de un (no único) funcional lineal no nulo sobre V. 


Demostración. Sea f un funcional linea no nulo sobre V y N, su espacio 
nulo. Sea a un vector de V que no esté en N,; 2s decir, un vector tal que fla) + O. 
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Se demostra pá que todo vector de V está en el subespacio generado por N, y a. 
l'se subesParrcio consta de todos los vectores 


y + ca, y en N,, c en F. 
Sea ff en Vs Se define 


_F6) 
“= $) 


que tiene Stentido porque fía) + 0. Entonces el vector y = $ — co pertenece 
u N,, ya Qyue 


Fr) = F(8 — ca) 
= f(8) — cfla) 
= 0. 


Con lo que $ está en el subespacio generado por N, y a. 

Sea ahOra N un hiperespacio en V. Sea a algún vector que no pertenece 
11 N. COMO, N es un subespacio propio maximal, el subespacio generado por N 
y a es toda, el espacio V. Por tanto, todo vector ff de V tiene la forma 


B = y + ca, yen N, c en F. 


il vector ) y el escalar c están univocamente determinados por f. Si se tiene 
también Qe 
PB=y"+<a, y" en N, c” en F 
entonces 
(c” — cla = y — y”. 

SIC” — C 34 0, entonces a estaría en N; luego c* =c y y' = y. Otra manera 
de formular esta conclusión es: Si $ pertenece a V, existe un único escalar c 
tal que B =- Ca pertenece a N. Sea g(f) ese escalar. Es fácil ver que g es un fun- 
cional line:a] en Y y que N es el espacio nulo de g. | 

Lema. si f y g son funcionales lineales en el espacio vectorial V, entonces 
£ es un MUultiplo escalar de f si, y solo si, el espacio nulo de g contiene al espacio 
nulo de f3 esto es, si, y solo si, fla) = 0 implica que g(a) = 0. 


Demostración. Si f = 0 entonces también g =0 y g es trivialmente un 


múltiplo €scalar de f. Supóngase que f + O de modo que el espacio nulo N, 
sea un Hiberespacio en V. Elíjase algún vector a en Y con fla) + 0, y sea 
_gla) 


c-= === 

fa) 
El funcior,a] lineal h = g — cf es O sobre N,, ya que tanto f como g son ahí 0 
y ha) = ig(a) — cfla) = 0. Así h es O en el subespacio generado por N, y a 
TY eS Subespacio es V. Se concluye que h = 0; es decir, que g = cf. 


Teorema 20. Sean g, fu ---, f. funcionales lineales sobre un espacio vec- 
¡orial V Cy espacios nulos N, ÑN,, ..., N,, respectivamente. Entonces g es una 
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combinación lineal de los f,, .... f, si, y solo si, N contiene la intersección 


NO: ANN. 


Demostración. Si g =C,f, +: +Cf, y f;¡(a) = O para todo i, enton- 
ces evidentemente, g(a) = 0. Por tanto, N contiene N, N1:::NNÑ,. 

Demostraremos el recíproco (la parte «sm del teorema) por inducción so- 
bre el número r. El lema precedente se refiere al caso en que r = 1. Supóngase 
que el resultado sea válido para r = k — 1 y sean f,,.... fi. funcionales lineales 
con espacios nulos N,,..., N, tales que N, (1: :: MN, está contenido en N, el 
espacio nulo de g. Sean g', f;, ..., fi-1 las restricciones de g, f;, ..., fi-1 al 
subespacio N,. Entonces g”, fi, ..., f;-, son funcionales lineales sobre el es- 
pacio vectorial N,. Además, si a es un vector de N, y f¿(a) = 0, =1,...,k -— 1, 
entonces a está en N, (1:*: (1N,, con lo que g'(a) = O. Por la hipótesis de 
inducción (el caso r = k — 1), existen escalares c, tales que 


gd =afñio+ +: + Ofi: 


Sea ahora 
k—1 
(3-16) h=q- z Cif. 


Con lo que A es un funcional lineal en V y (3-16) dice que h(a) = O para todo 
o en N,. Por el lema anterior h es un múltiplo escalar de /,. Si h = c;f,, entonces 


k 
g = 2 Cas. | 


Ejercicios 
1. Sean un entero positivo y Fun cuerpo. Sea W el conjunto de todos los vectores (x;,... . ,X,,) 
de F” tales que x, + ::: + x, =0. 
(a) Demostrar que WY% consta de todos los funcionales lineales f de la forma 
n 
Jn --120) =0 Y 25 
3= 
(b) Hacer ver que el espacio dual W* de W puede identificarse «naturalmente» con 
los funcionales lineales 
(21, . . . ¿ Tn) = CT + ... + CrTa 
sobre F” que satisface c, + :*: +4 =0,. 


2. Usando el Teorema 20, demostrar lo siguiente. Si W es un subespacio de un espacio 
vectorial de dimensión finita V y si fg,, ..., g,) es cualquier base para W?, entonces 


W = ñ No. 
¡=] 
3. Sea S un conjunto, F un cuerpo y V(S; F) el espacio de todas las funciones de S en F: 
(F+ yg) = f(1) + g(z) 
(cf) (x) = cf(x). 


Sea W cualquier subespacio de dimensión n de V(S: F). Demostrar que existen puntos 
Xi» »-.» xn €n $ y funciones f,, ..., f, en W tales que f.(x,) = Ó;;. 
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1.7. Transpuesta de una transformación lineal 


Supóngase que se tienen dos espacios vectoriales Y y W sobre el cuerpo F 
y una transformación lineal 7 de V en W. Entonces T induce una transfor- 
mición lineal de W* en V*, como sigue. Supóngase que g es un funcional lineal 
en W, y sea 


(3-17) fla) = g(Ta) 


para cada a. en V. Entonces (3-17) define una función f de V en F, que es la com- 
posición de 7, función de V en W, con g, función de W en F. Como ambas, 
Il" y g, son lineales, el Teorema 6 dice que f es también lineal; vale decir, f es 
una función lineal en V. Así T suministra una correspondencia 7' que asocia 
a cada funcional lineal g sobre W un funcional lineal f = T"g sobre V, defini- 
do por (3-17). Obsérvese también que 7' es igualmente una transformación 
lincal de W*; en efecto, si g, y g, están en W* y c es un escalar 


[T(cg + g2)l(a) = (cg + gd (Ta) 
cul Ta) + g(Ta) 
c(T'g)(a) + (Tga)(a) 


de modo que T'*(cg, + g,) = cT'g, + T'"g,. Resumamos. 


Teorema 21. Seun V y W espacios vectoriales sobre el cuerpo F. Para toda 
transformación lineal T de V en W, existe una única transformación lineal T' de 
W* en V* tal que 

(T'gMa) = g(To) 


para todo g de W* y todo a de V. 


A T' se la llama transpuesta de 7. Esta transformación 7* también se llama 
ld menudo adjunta de 7, pero no usaremos esta terminología. 


Teorema 22. Seun V y W espacios vectoriales sobre el cuerpo F y sea T una 
transformación lineal de V en W. El espacio nulo de T' es el anulador de la imagen 
de T. Si V y W son de dimensión finita, entonces 


(1) rango (T") = rango (T) 
(11) la imagen de T' es el anulador del espacio nulo de T. 


Demostración. Si g pertenece a W*, entonces por definición 
(T'g Ma) = g(Ta) 


para todo x de V. La afirmación de que g está en el espacio nulo de 7" quiere 
decir que g(Tx) = O para todo a de V. Así el espacio nulo de 7” es, precisa- 
mente, el anulador de la imagen de 7. 

Supóngase que V y W son de dimensión finita, por ejemplo, dim Y = n 
y dim W = m. Para (1): Sea r el rango de T, es decir, la dimensión de la imagen 
de T. Por el Teorema 16 el anulador de la imagen de T tiene entonces dimen- 
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sión (m — r). Por la primera afirmación de este teorema la nulidad de 7" debe 
ser (m — r). Pero entonces, como 7” es una transformación lineal en un espacio 
de dimensión m, el rango de 7T* es m — (m — r) = r, y así T y T' tienen el mismo 
rango. Para (11): Sea N el espacio nulo de 7. Todo funcional en la imagen de 
T' está en el anulador de N; en efecto, supóngase que f = T'"g para algún g 
en W*; entonces, si a está en N 


fla) = (T'gMa) = g(Ta) = g(0) =0. 
Ahora bien, la imagen de 7" es un subespacio del espacio N%, y 


dim N% = n — dim N = rango (7) = rango (7”) 
con lo que la imagen de 7* debe ser, exactamente, N%. | 


Teorema 23, Sean V y W espacios vectoriales de dimensión finita sobre 
el cuerpo F. Sea GB una base ordenada de V con base dual B*, y sea R' una base 
ordenada de W con base dual B'*. Sea T una transformación lineal de V en W; 
sea A la matriz de T respecto a (B, KB' y sea B la matriz de T' respecto a B'*, B*. 
Entonces B,; = Aj;. 


Demostración. Sea 
BG = ([a1,...,Qn), B' = (Br... , Bm), 
G* = (fi e... rÍn), B'* = (91, e...) Jm) - 
Por definición, 


Ta; = S Asbs, j=1,...,n 
¿=1 
T*g, = 2 Bifi j=1,...,m. 
Por otro lado, ll 
(T"g,)(a:) = gi(Ta;) 
= Y; ( 2, Aux) 
k=1 
= Y Ax:9(Bx) 
km1 


2 Arijr 
k==1 
= Á si. 
Para cualquier funcional lineal f sobre Y 
f.= 2 flas)f:. 


Si se aplica esta fórmula al funcional f = T"g; y se considera que (7"g,Xa;)= Aj, 
se tiene 


T'g, = 2 As i 


de donde se desprende en forma inmediata que B,,= Aj. 


Pronsformaciónes lineales pS 


Definición. Sí A es una matriz m x n sobre el cuerpo F, la transpuesta de 
tos la matriz n x m, A', definida por A;; = Aj. 


El Teorema 23 dice, pues, que si 7 es una transformación lineal de V en W, 
cuya matriz con respecto a un par de bases es A, entonces la transformación 
transpuesta 7" está representada, en el par de bases dual, por la matriz trans- 
puesta 4”. 


Teorema 24. Sea A cualquier matriz m x n sobre el cuerpo F. Entonces 
el rango de filas de A es igual al rango de columnas de A. 


Demostración. Sea (3 la base ordenada canónica de F" y 03 la base ordena- 
da canónica de F”. Sea T la transformación lineal de F” en F” tal que la matriz 
de T respecto al par GH, (GB3' sea A; es decir, 


T(%1, . - ., Tn) = (Yi, - - - , Ym) 
donde 


n 
Yi = > Asjtj. 
j=l 


I:l rango de columnas de A es el rango de la transformación 7, pues la imagen 
de T consta de todos los m-tuples que son combinaciones lineales de los vec- 
tores columnas de A. 

Respecto a las bases dual 63'* y (G3*, la aplicación transpuesta 7” está re- 
presentada por la matriz A. Como las columnas de A' son las filas de A, se ve 
que por la misma razón que el rango de filas de A (el rango de columnas de A*) 
es igual al rango de 7”. Por el Teorema 22, T y T' tienen el mismo rango y, por 
tanto, el rango de filas de A es igual al rango de columnas de A. | 


Ahora vemos que si 4 es una matriz m x n sobre F y T es la transformación 
lineal de F” en F” definida anteriormente, entonces 


rango (7) = rango de filas (4) = rango de columna (4) 


y se dirá simplemente que este número es el rango de A. 


Ejemplo 25. Este ejempló será de carácter general; más bien una discu- 
sión que un ejemplo. Sea V un espacio vectorial de dimensión n sobre el cuer- 
po F y sea T un operador lineal sobre V. Supóngase que G = ([a,, ..., 0%) 
es una base ordenada de V. La matriz de T en la base ordenada Gh está definida 
como la matriz n x n, A, tal que 


n 
Ta; = 2 A ¡jas 
yu 


o sea, que Aj, es la ¡-ésima coordenada del vector Ta, en la base ordenada 65. 
Si ff, ..., fa es la base dual de (KB, esto puede enunciarse simplemente 


Ay = fi(Tas). 
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Se verá ahora qué sucede cuando se cambia de base. Supongase que 
B'= (01,..., an) 


es otra base ordenada de V con base dual (f¡. .... f,;. Si B es la matriz de T en 
la base ordenada (GB', entonces 


B;¡ = fiTa;). 


Sea U el operador lineal inversible, tal que Ux, = x;. Entonces la transpuesta 
de U viene dada por U'"f;' = f,. Esto es de fácil verificación. ya que como U es 
inversible, también lo es U? y (U')”* =(U7'). Así, fí =(U*Yf,¡=1,2,...,m. 
Por tanto, 

B;; 


(UH, (Ta) 
f(U=TTa;) 

= f(UTUa,). 
Y ahora, ¿qué dice esto? Bien, £(U”*TUx;,) es el elemento :. j de la matriz 
U”*TU en la base ordenada GB. Los cálculos anteriores indican que este escalar 
es también el elemento ¿, j de la matriz de T en la base ordenada 63”. Es decir, que 

[Tlay = [UATU1e 
= [U-Ne[TlelUla: 
= [Ulea [Tle[Ule 


lo que, precisamente, es la fórmula para el cambio de base va conocida. 


Ejercicios 


1. Sea F un cuerpo y sea f el funcional lineal en F? definido por f(x,. v,) = ax, + bx). 
Para cada uno de los siguientes operadores T. hágase g = T'f y hállese g(x,. x,). 


(a) T(z,, 22) = (x1, 0); 
(b) T(z,, 22) = (—x2 11); 
(c) T(z,, 12) = (z: — Lg, TY +4 Ta). 


2. Sea V el espacio vectorial de todas las funciones polinomios sobre el cuerpo de los nú- 
meros reales. Sean a y b dos números reales fijos y sea f el funcional lincal en Y definido por 


b 
10) = || nía) az. 
Si D es el operador derivación sobre V. ¿qué es D'f? 


3. Sea V el espacio de las matrices n x n sobre el cuerpo F y sea B una matriz n x n dada. 
Si 7 es un operador lineal sobre Y definido por T(4) = AB — BA y si f es la función traza. 
¿qué es Tf? 


4. Sea V el espacio vectorial de dimensión fintta sobre el cuerpo F y sea T un operador 
lineal sobre V. Sea c un escalar y supóngase que existe un vector no nulo x en 1 tal que 
Ta = ca. Demostrar que existe un funcional lineal no nulo f en I' tal que T'f = «/. 


S. Sea A una matriz m x n de elementos reales. Demostrar que A =0 u. y solo si. 
traza (4'A) = 0. 


Lrumajormauciones lineales 
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6. Sea un entero positivo y sea Y cl espacio de las funciones polinomios sobre el cuerpo 
de los números reales que tienen grado n a lo más; es decir, funciones de la forma 


fio) =cuwtar+--. +<cnz”. 


Seu D el operador derivación sobre V. Hallar una base del espacio nulo del operador trans- 
puesto D”. 


7. Sea V un espacio vectorial de dimensión finita sobre el cuerpo F. Demostrar que T — T' 
xÑ un isomorfismo de L(V, V) sobre L(V*, V*). 


”, 


NH. Sua V el espacio vectorial de las matrices n x n sobre el cuerpo F. 


(a) Si B es una matriz n x n dada, se define una función fj sobre V por fa(A) = tra- 
¿4 (B'A). Demostrar que fz es un funcional lineal en Y. 
(b) Demostrar que todo funcional lineal sobre V es de la forma anterior, es decir, es 
para algún B. 
ic) Demostrar que B= fy es un isomorfismo de Y sobre V*. 


a, 
= 


4. Polinomios 


4.1. Algebras 


El propósito de este capítulo es establecer algunas de las propiedades bá- 
sicas del álgebra de polinomios sobre un cuerpo. El tratamiento se facilitará 
si se introduce primero el concepto de un álgebra lineal sobre un cuerpo. 


Definición. Sea F un cuerpo. Un álgebra lineal sobre el cuerpo F es un es- 
pacio vectorial ( sobre E con otra operación, llamada multiplicación de vectores, 
que asocia a cada par de vectores a, f$ de Q un vector af$ en Q llamado el producto 
de a y P, de tal modo que 


(a) la multiplicación es asociativa, 
ap) = (af); 
(D) la multiplicación es distributiva con respecto a la adición, 
AB) =a Bda y a 04 bs 
(c) para todo escalar c de F, 
claf) = (ca)f = altcf$). 


Si existe un elemento 1 en Q tal que la = al = a para todo a de A, QA se llama 
u.* álgebra lineal con unidad sobre F, y au 1 se le llama la unidad de G. El álgebra 
G se dice conmutativa si af = fa, para todo a y fi de Ct. 


Ejemplo 1. El conjunto de las matrices n x n sobre un cuerpo, con las 
Operaciones corrientes. es un álgebra lineal con unidad; en particular el cuerpo 
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mismo es un álgebra lincal con unidad. Este álgebra no es conmutativa sin > 2. 
Il cuerpo mismo us (evidentemente) conmutativo. 


Ejemplo 2. El espacio de todos los operadores lineales sobre un espacio 
vectorial, con la composición como producto, es un álgebra lineal con uni- 
did. Es conmutativa si, y solo si, el espacio es unidimensional. 


Es posible que el lector tenga alguna experiencia con el producto escalar 
y el producto vectorial de vectores de R?. De ser así, debe observar que nin- 
puno de estos productos es del tipo descrito en la definición de álgebra lineal. 
1:l primer producto es un «producto escalar» en el sentido que asocia a cada 
par de vectores un escalar, no siendo por consiguiente del tipo de producto 
que se discute ahora. El producto vectorial asocia un vector a cada par de vec- 
tures de R?; pero ésta no es una multiplicación asociativa. 

En lo que resta de esta sección nos ocuparemos de la construcción de un 
Jlgebra que es significativamente diferente de las álgebras de los ejemplos an- 
leriores. Sean F un cuerpo y S el conjunto de los enteros no negativos. Por el ' 
l:jemplo 3 del Capítulo 2, el conjunto de las funciones de S en F es un espacio 
vectorial sobre F. Se representará este espacio vectorial por F”. Los vectores 
de F son, por tanto, sucesiones infinitas £ = (fo, fi, f, . - .) de escalares f, de 
Il Sig = (Zo, 21» £2, - - - ) con g, en F, y a, b escalares de F, af + bg es una su- 
cesión infinita dada por 
(1-1) af + bg = (afo + bgo, afi + dg1, afa + dga, - - -). 


Definimos un producto en F” asociando a cada par de vectores f y g de F? 
el vector fg dado por 


(4-2) HN n = 2 Signs n= O, 1, 2, e... 
Asi fo = foo Sm +90 fr + hm +20 -- 
y como ” n 
(9/)n = E dibns= E gn = (19)n 
para n=0, 1, 2, ..., se sigue que la multiplicación es conmutativa, fe = gf. 
Si A también pertenece a F”, entonces 


[Gh 


Y UNihn 
1$=0 


ll 


y ( >) ii) 


¡=0 Nju 


ll 


2 3 f ¡Qi—jhn—i 
i=03=0 


n n—j 
= 2 $, 2 Gini 
j=0 2=0 


= 3 140N),,= L50h)), 
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para n= 0, 1, 2, ..., de modo que 
(4-3) (Jah = f(gh). 


Se deja al lector verificar que la multiplicación definida por (4-2) cumple (b) 
y (c) en la definición de un álgebra lineal y que el vector 1 = (1, 0, 0, .. .) sirve 
como unidad para F”. Entonces F”, con las operaciones definidas anterior- 
mente, es un álgebra lineal conmutativa con unidad sobre el cuerpo F. 

El vector (0. 1. 0,...,0,...) juega un papel destacado en lo que sigue y se 
representará siempre por x. A lo largo de este capítulo munca se usará x para 
indicar un elemento del cuerpo F. El producto de x por sí mismo n veces se 
representará por x” y se hará que x% = 1. Entonces 


q? = (0, 0,1,0,.. .), xi = (0, 0, 0, 1,0,...) 


y, en general, para todo entero k > 0, (x*), = 1 y (x*), = 0 para todo entero 
no negativo n + k. Para concluir esta sección observamos que el conjunto 
formado por l, x, x*,..., es independiente e infinito. Así que el álgebra F” no 
es de dimensión finita. 

El álgebra F” se llama también álgebra de las series formales de potencias 
sobre F. El elemento f = (fo, fi» f2 --.) se suele escribir 


(4-4) f= E fas 


Esta notación es muy conveniente para manipular las operaciones algebraicas. 
Cuando se use, debe recordarse que es puramente formal. No existen «sumas 
infinitas» en álgebra y la representación en serie de potencias (4-4) no pretende 
sugerir nada respecto a convergencia, si es que el lector sabe de qué se trata. 
Usando sucesiones se puede definir rigurosamente un álgebra en que las ope- 
raciones se comporten en forma semejante a la adición y multiplicación de 
series formales de potencias, sin caer en el riesgo de confundirse acerca de cosas 
tales como sumas infinitas. 


4.2. El Algebra de los polinomios 


Se está ahora en condiciones de definir un polinomio sobre el cuerpo F. 


Definición. Sea F|x] el subespacio de F” generado por los vectores 1, x, 


x?, ... Un elemento de F|x] se llama polinomio sobre F. 


Como F[x] consta de todas las combinaciones lineales (finitas) de x y sus 
potencias, un vector no nulo f de F” es un polinomio si, y solo si, existe un 
entero n > 0 tal que f, + 0 y tal que f, = 0 para todos los enteros k > n; este 
entero (cuando existe) es obviamente único y se llama grado de f. Se represen- 
tará el grado de un polinomio f por grd f, y no se asignará grado a! polinomio O. 
Si f es un polinomio no nulo de grado n se tiene que 


(4-5) I=W+farfa ++ fat”, 1, %0, 
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los escalares fo, f,. .. ., f son llamados a veces los coeficientes de f, y se dirá 
que f es un polinomio con coeficientes en F. Se llamarán polinomios escalares 
a los polinomios de la forma cx? y frecuentemente se escribirá c en vez de cx?. 
tin polinomio no nulo f de grado n tal que f, = 1 se dice que es un polinomio 
monico. 

El lector observará que los polinomios no son la misma clase de objetos 
que las funciones polinomios sobre F que se han estudiado varias veces. Si 
/" ticne un número infinito de elementos, existe un isomorfismo natural entre 
Fx] y el álgebra de las funciones polinomios sobre F. Ello se verá en la próxi- 
ma sección. Verifiquemos ahora que F[x] es un álgebra. 


Teorema 1. Sean f y g polinomios no nulos sobre F. Entonces 


(1) fg es un polinomio no nulo; 

(11) grd (fg) = grd f + grd g,; 
(11) /fg es un polinomio mónico si ambos, f y g, son polinomios mónicos; 
(iv) fg es un polinomio escalar si, y solo si, ambos f y g son polinomios escalares; 
(v) si f4+4 g%0, 


grd (f + g) < máx. (grd f, grd g) 
Demostración. Supóngase que f tiene grado m y que g tiene grado n. Si 


k es un entero no negativo, 


f ¡Jm+4n-+k—i- 


m+n+k 
(J9)min+x = 2 


Para que f2m+n+r-¡ + O es necesario que ¡ <mym +n+k-—i< mn. Luego 
es necesario que m + k < i< m, lo que implica k =0 e ¡= m. Así, 


(4-6) (FI) min = FmGn 
y 
(4-7) (Í)m+n+a = 0, k > 0. 


Las afirmaciones (1), (11), (111) se desprenden inmediatamente de (4-6) y (4-7), 
mientras que (iv) es una consecuencia de (1) y (i1). Se deja la comprobación de 
(v) al lector. | 


Corolario 1. El conjunto de todos los polinomios sobre el cuerpo F dado 
dotado de las operaciones (4-1) y (4-2) es un álgebra lineal conmutativa con uni- 
dad sobre F. 


Demostración. Como las operaciones (4-1) y (4-2) son aquellas definidas 
en el álgebra F? y como F[x] es un subespacio de F”, es suficiente demostrar 
que el producto de dos polinomios es también un polinomio. Ello es trivial 
cuando uno de los factores es 0, y en los otros casos se deduce de (1). | 


Corolario 2. Supóngase que f,.g y h son polinomios sobre el cuerpo F tales 
que Ff £0 y fg = fh. Entonces g = h. 


120 Algebra lincal 


Demostración. Como fg = fh. fle —h)=0 y f F 0, se sigue inmedia- 
tamente de (i) que € -h=0. |] 


Otros hechos más se desprenden fácilmente de la demostración del Teore- 
ma 1, y de algunos de ellos haremos mención. Supóngase 


f= 3 f4 y y= 2 gx. 
=0 j=0 


Entonces de (4-7) se tiene 


as mE (Eme 


El lector deberá comprobar, para el caso particular f = cx”, g = dx” con 
c, d en F, que (4-8) se reduce a 


(4-9) (cx”)(dx”) = cdxr+”. 


Ahora, de (4-9) y las leyes distributivas en F[x], se sigue que el producto en 
(4-8) también está dado por 


(4-10) 2 figja+ 
1, 


donde la suma se extiende sobre todos los pares de enteros i, j tales que 
O<i<my0<j<n. 


Definición. Sea ( un álgebra lineal con unidad sobre el cuerpo F. Se in- 
dicará la unidad de (% por 1 y se conviene que a% = 1 para todo a de G. Entonces 
a cada polinomio f = Y fx" sobre F y a de G se asocia un elemento fla) de Q 
por la ley a , 

fa) = E fl 
Ejemplo 3. Sea C el cuerpo de los números complejos y sea f = x? + 2. 


(a) Si G =C y z pertenece a C, fíz) = 2? + 2, en particular f(2) = 6 y 
) 


142 
5 — :) =1 
(b) Si G es el álgebra de todas las matrices 2 x 2 sobre C y si 
1.0 
B=|_1 2] 


10 1 07 3 0 
HB) = 2, 1] + [; >| = [3 6) 
(c) Si G es el álgebra de todos los operadores lineales en C? y T es el ele- 


mento de GQ dado por 


T(c1, Ca, 03) = (¿W2 cr, 02, ¿W2 es) 





entonces 
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entonces /(7) es el operador lineal sobre C? definido por 
Dc, Ca, C3) - (0, 3C2, 0). 


(d) Si G es el álgebra de todos los polinomios sobre C y g = x%* + 31, 
entonces f(g) es el polinomio de (GR dado por 


fly) = —7 + 6ix? + e, 


El lector atento habrá observado, en conexión con este último ejemplo, 
que si f es un polinomio sobre cualquier cuerpo y x es el polinomio (0, 1, 0, ....), 
entonces f = f(x), pero se le aconseja olvidar este hecho. 


Teorema 2. Seu F un cuerpo y (Run álgebra lineal con unidad sobre F. Su- 
pongase que f y g son polinomios sobre F, que a es un elemento de G y que c per- 
tenece a F. Entonces 


(1) (cf + glMa) = cf(a) + gla); 
(1) GfeMo) = fa) (0). 
Demostración. Como (1) es fácil de probar, se demostrará solamente (ii). 


Supóngase que 


Sf = 3 0 y Yy= 239x. 


j=0 
Por (4-10), la = ESgair 
1,3 


y luego por (1), o 
(Into) = 2 figja** 


- (Eso) Eo) 


= flajg(a). | 


Ejercicios 
Il. Sea F un subcuerpo de los números complejos y sea A la siguiente matriz 2 x 2 


sobre F 
2 1 
4 = me 3] 


Para cada uno de los siguientes polinomios f sobre F, calcular f(A). 
(a) f = 2? — x + 2; 
(b) f=%= 1; 
(0) f = 22 — dx +17. 
2. Sea T el operador lineal 7 sobre R? definido por 
T(2,, La, La) = (11, La, — 212 — 23). 


Sea f el polinomio sobre R definido por f = —x? + 2. Hallar f(T7). 
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3. Sea A una matriz diagonal n x n sobre el cuerpo F, es decir, una matriz para la cul 
A; = O para ¡+ j. Sea f el polinomio sobre F' definido por 


f = (zx — An) ... (x — Á nm). 
¿Cuál es la matriz f(4)? 


4. Si f y g son polinomios independientes sobre el cuerpo F y h es un polinomio no nulo 
sobre F. Demostrar que fh y gh son independientes. 


5. Si F es un cuerpo, demostrar que el producto de dos elementos no nulos de F” es 
no nulo. 


6. Sea S un conjunto de polinomios no nulos sobre el cuerpo F. Si no hay dos elementos 
de S que tengan el mismo grado, demostrar que S es un conjunto independiente de F[ x]. 


7. Sta y b son elementos de un cuerpo F y a + 0, demostrar que los polinomios 1, ax + b, 
(ax + bY, (ax + by, ... forman una base de F[x]. 


8. Si F es un cuerpo y h es un polinomio sobre F de grado >1, demostrar que la aplica- 
ción f—= f(h) es una transformación lineal inyectiva de F[x] en F[x]. Demostrar que 
esta transformación es un isomorfismo de F[x] sobre F[x] si, y solo si, grd k = 1. 


9. Sea F un subcuerpo de los números complejos y sean 7, D las transformaciones sobre 
F[x] definidas por 





n . n Ci + 
TT Y cai)= > Jia 


1=0 $1=0 


n n 
DI Y cx]= > ica.!. 
¡=0 i=1 
(a) Demostrar que 7 es un operador lineal no singular sobre F[x]. Demostrar también 
que T no es inversible. 
(b) Demostrar que D es un operador lineal sobre F[x] y determinar su espacio nulo. 
(c) Demostrar que DT = ] y que TD H I. 
(d) Demostrar que 7[(7N2] = (T/UTg) — TÁTg) para todo f, g en F[x]. 
(e) Formular y demostrar una ley para D análoga a la dada para T en (d). 
(f) Supóngase que Y es un subespacio no nulo F[x] tal que Tf pertenezca a Y para 
todo f de Y. Demostrar que V no es de dimensión finita. 
(g) Supóngase que Y es un subespacio de dimensión finita de F[x]. Demostrar que 
existe un entero m > 0 tal que D”"f = 0 para todo f en V. 


4.3. Interpolación de Lagrange 


En esta sección F es un cuerpo fijo y to, ty, . .-, f, son n + 1 elementos dis- 
tintos de F. Sea V el subespacio de F[x] que consta de todos los polinomios 
de grado menor o igual a n (junto con el polinomio 0), y sea £, la función de 
V en F definida para f en Y por 


L(f) =$); 0<t<nm. 
Por la parte (i) del Teorema 2, todo £, es un funcional lineal sobre Y, y una 


de las cosas que interesan es demostrar que el conjunto constituido por los Lo, 
Li, ..., L, es una base de V*, el espacio dual de Y. 
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Por supuesto, que, para que sea así, es suficiente (en referencia al Teorema 15 
del Capítulo 3) que (Lo, L,, .. ., L, y sea el dual de una base [Po, P,, ..., P,) 
de V. A lo más existe una de.tales bases y si existe está caracterizada por 


(4-11) L¡(P;) = Px(tj) = 6sj. 
llos polinomios 


(4-12) P; = (ts — to) => (li — tits — tiy1) >= > (E: — ta) 


- 1) 
jos Mts — l; 
son de grado n, luego pertenecen a V, y por el Teorema 2 satisfacen (4-11). 
Si f = X c;¡P,, entonces para todo J, 


(4-13) ft) = 2.ciP(t;) = Cj. 


Como el polinomio O tiene la propiedad que 0(1) = O para todo t en F,, se sigue 
de (4-13) que los polinomios Pp, P,, ...., P, son linealmente independientes. 
Los polinomios 1, x, ..., x” forman una base de Y y, por tanto, la dimensión 
de V es (n + 1). Así el conjunto independiente (P,, P,, ..., P,) tiene que ser 
también una base de V, Con lo que para todo f de V 


(4-14) = E S0)Po 


La expresión (4-14) se llama la fórmula de interpolación de Lagrange. Poniendo 
f = x! en (4-14), se tiene 


ai = 2 (ti Ps. 
Ahora bien, del Teorema 7 del Capítulo 2, se sigue que la matriz 


lt 8-8 
(4-15) 1404: 4 
1 tn LE e... ta 
es inversible. La matriz en (4-15) se llama una matriz de Vandermonde; es un 
ejercicio interesante demostrar en forma directa que tal matriz es inversible 
cuando to, ft,, -.., f,h son n + 1 elementos distintos de F. 

Si f es cualquier polinomio sobre F, en el presente tratamiento se represen- 
tará por f” la función polinomio de F en F que aplica todo t de F en f(1). Por 
definición (véase Ejemplo 4, Capítulo 2), toda función polinomio surge de esta 
forma; sin embargo, puede suceder que f” = g” para dos polinomios f y g 
tales que f + g. Afortunadamente, como se verá, esta situación poco placen- 
tera solo sucede en el caso en que F es un cuerpo que tiene un número finito 
de elementos distintos. Para describir en forma precisa la relación entre polt- 
nomios y funciones polinomios, se necesita definir el producto de dos funcio- 
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nes polinomios. Si f, g son polinomios sobre F, el producto de f” y g” es la 
función f"g” de F en F dada por 


(4-16) (FINO =F OF, ten F. 
Por la parte (11) del Teorema 2, (fgMr) = f(t)g(t), y entonces 
NO =F WM) 


para cada ten F. Así, f"g” = (fg), y es una función polinomio. Ahora ya 
es inmediato, y se deja al lector, verificar que el espacio vectorial de las funcio- 
nes polinomios sobre F es un álgebra lineal con unidad sobre F si la multipli- 
cación está definida por (4-16). 


Definición. Sea F un cuerpo y sean AQ y A” dos álgebras lineales sobre F. 
Las álgebras Q y (R” se dicen isomorfus si existe una aplicación bivectiva a — a” 
de QU en G” tal que 

(a) (ca + df$Y” = ca. + df" 

(b) (ap) =x Pp 
para todo a, fB de G y todo escalar c, d de F. De la aplicación a — a” se dice que 
es un isomorfismo de (2 sobre GR”. Un isomorfismo de (Q sobre R” es entonces 
un isomorfismo de espacios vectoriales de (4 sobre R” que tiene, además, la pro- 
piedad (b) de «preservar» productos. 


Ejemplo 4. Sea V un espacio vectorial de dimensión n sobre el cuerpo F. 
Por el Teorema 13 del Capítulo 3 y las observaciones subsecuentes, cada base 
ordenada (3 de V determina un isomorfismo 7 — [7] del álgebra de los ope- 
radores lineales sobre V sobre el álgebra de las matrices 2» x n sobre F. Supón- 
gase ahora que U es un operador lineal fijo y que se ha dado un polinomio 


n . 
f= Y cx . 
i=0 
con coeficientes c, en F. Entonces 
n 
NU) = 3 00 
que 


y como T—>|[T7]¿g es una aplicación lineal, 


[NU 14 = 3 0Ula. 
Ahora, del hecho adicional que 
[T¡T2le = [Tila[T:1e 
para todo T,, T, en L(V, V), se sigue que 
[U*la = ([Ula), 2<1i<nm. 
Como esta relación es válida también para ¿ = 0, 1 se tiene el resultado 


(4-17) [0 le = F(1UJe). 
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lin otras palabras, si U es un operador lineal sobre Y, la matriz de un polinomio 
en U, en una base dada es el mismo polinomio en la matriz de U. 


Teorema 3. Si F es un cuerpo que tiene un número infinito de elementos 
distintos, la aplicación f — f”” es un isomorfismo del álgebra de polinomios sobre 
F, sobre el álgebra de las funciones polinomios sobre F. 


Demostración. Por definición, la aplicación es sobreyectiva y si f, g perte- 
necen a F[x] es evidente que 


(cf + da)” = df” + dy” 


para todo escalar c y d. Como ya se ha visto que (fg)” = f”g”, se necesita 
solo demostrar que la aplicación es inyectiva. Para ello es suficiente, por la 
linealidad, demostrar que f” = 0 implica f = 0. Supóngase, entonces, que f 


es un polinomio de grado n, o menor, tal que f” = 0. Sean to, t,, ...,tp,n + 1 
elementos distintos cualesquiera de F. Como f” =0, f(t,) = 0 para ¡ = 0, 
l, ..., n, y es una inmediata consecuencia de (4-14) que f=0. | 


De los resultados de la siguiente sección obtendremos una demostración 
totalmente diferente de este teorema. 


Ejercicios 
l. Usando la fórmula de interpolación de Lagrange, hallar un polinomio f, con coeficien- 
tes reales, tal que f tenga grado <3 y que f(-— 1) = —6, f(0) = 2. f(1) = —2, /f(2) = 6. 


2. Sean a, fi, y, Í números reales. Se pregunta, ¿cuándo es posible hallar un polinomio 
f sobre R, de grado no mayor que 2, tal que f(— 1) = a, (1) = f, [B)= y y F(0) = 9? 
Demostrar que ello solo es posible si, y solo st 

3a + 68 — y — 80 = 0. 
3. Sea F el cuerpo de los números reales, 


2000 
lo 200 
4=l0030 
0001 

p = (zx — 2)(x — 3)(x — 1). 


(a) Demostrar que p(4) = 0. 

(b) Sean P,, P,, Py los polinomios de Lagrange para tf, = 2, t, = 3, ft, = 1. Calcular 
E, = P¡(A), i = 1, 2, 3. 

(c) Demostrar que E, + E, + E,=I1, E¡E,=0si ¡4 j, El = Ej. 

(d) Demostrar que Á = 2E, + 3E, + E,. 


4. Sea p = (x — 2Xx — 3)Mx — 1) y sea T cualquier operador lineal sobre R* tal que 
ptT) = 0. Sean P,, P,, P, los polinomios de Lagrange del Ejercicio 3 y sea E, = P,(T), 
¡= 1, 2, 3. Demostrar que 


E+E:+Es=1, EE¡=0 si 1%j3, 
E? = E,, y T = 2E, + 3E, + E. 
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5. Sea n un entero positivo y F un cuerpo. Supóngase que Á es una matriz n x n sobre PF y 
P una matriz n x n inversible sobre F. Si f es cualquier polinomio sobre F, demostrar que 


FP AP) = Pf(AJP. 


6. Sea F un cuerpo. Se han considerado ciertos funcionales lineales especiales en F[x] 
obtenidos por «evaluación en f»: 


LH = Kt). 


Tales funcionales no son solo lineales, sino que también tienen la propiedad de que 1 (f2) = 
LUNL(g). Demostrar que si L es cualquier funcional lineal sobre F[x] tal que 


LUN = KN LY) 
para todo f y g, entonces L = 0, o existe un t en F tal que L(f) = f(t) para todo f. 


4.4. Ideales de polinomios 


En esta sección se tratarán aquellos temas que dependen ante todo de la 
estructura multiplicativa del álgebra de los polinomios sobre un cuerpo. 


Lema. Supóngase que f y d son polinomios no nulos sobre un cuerpo F tal 
que grd d < grd f. Entonces existe un polinomio g de F|x)] tal que 


fr—dg=0 oO grdíf — dg) < grd f. 


Demostración. Supóngase que 
m-—1 . 
f = ant” + z az*, Am 70 
4 
y que 


n—1 
d =b,x" + z bix*, b, 0. 


Entonces m > hn, y 
f— (jaa =0 o grad L — (Ejea ] <grad f. 
Así que se puede tomar g = (5) an. 1] 


Usando este lema se puede ver ahora que el proceso familiar de división 
de polinomios con coeficientes reales o complejos puede hacerse sobre cual- 
quier cuerpo. 


Teorema 4. Si f, d son polinomios sobre. un cuerpo F y d es diferente de 0, 
entonces existen polinomios q, r en F|x)] tales que 


(1) f=dq+r. 
(1) o, r=0 0 grd r < grd d. 


Los polinomios q, r que satisfacen (i) y (ii) son únicos. 
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Demostración. Si fes0o de grd f < grd d, se puede tomar yg =0yr= ff. 
I-n caso de que f £ 0 y grd f > grd d, el lema anterior dice que se puede elegir 
un polinomio g tal que f — dg =0 0 grd (f — dg) < grd f. Si f - dg 40 y 
prd (f — dg) < grd d, se elige un polinomio Ak tal que (f — dg) — dh =0, o 


grd [f — d(g + h)] < grd (f — dg). 


Si se sigue este proceso tantas veces como sea necesario se llega a obtener 
polinomios q, r tales que r = 0 o grd r < grd d, y f = dq + r. Ahora supón- 
pise que también se tenga f — dq, + r,, donde r, = Oo grd r, < grd d. Enton- 
tonces dq + r=dg, +r, y díq — q1)=r,-—r. Si q — q, 40, entonces 
dq — q1) + 0, y 


grd d + grd (q — q1) = grd (r, — r). 


Pero como el grado de r, — r es menor que el grado de d, esto es imposible 
y 4-1; =0. Luego también r, — r=0. |] 


Definición. Sea d un polinomio no nulo sobre el cuerpo F. Si f p2rtenece 
a F[x], el teorema anterior dice que existe, a lo más, un polinomio q en F| x] tal 
que f = de. Si tal q existe, se dice que d divide a f. que f es divisible por d, que 
f es un múltiplo de d y que q es el cociente de f por d. Se escribirá, pues, q= f/d. 


Corolario 1. Sea f un polinomio sobre el cuerpo F y sea c un elemento de F. 
Entonces f es divisible por x — c si, y solo si, f(c) = 0. 


Demostración. Por el teorema, f = (x.— c)q + r, donde r es un polinomio 
escalar. Por el Teorema 2, 


fc) = Oglc) + r(c) = r(c). 
Luego r=0 si, y solo si, f(c) = O. 


Definición. Sea F un cuerpo. Un elemento c de F se dice raíz, o un cero, de un 
polinomio dado f sobre F si f(c) = O. 


Corolario 2. Un polinomio f de grado n sobre un cuerpo F tiene a lo más 
n raices en F. 


Demostración. La tesis es obviamente cierta para los polinomios de gra- 
do O y grado 1. Supóngase que es cierta para polinomios de grado n — 1. Si 
a es una raíz de f, f = (x — a)q, donde q tiene grado n — 1. Como flb) = 0 
si, y solo si, a = bo q(b) = 0, se sigue por la hipótesis de inducción que f tiene 
a lo más n raíces. | 


El lector debe observar que la etapa principal en la demostración del Teore- 
ma 3 se desprende inmediatamente de este corolario. 

La derivada formal de un polinomio es de gran utilidad en el estudio de 
las raíces múltiples. La derivada de un polinomio 


f = Co + car +--: +Cor” 
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es el polinomio 


f =C1+ 2014 ++ 4 nena”! 


También se usa la notación Df = f”. La derivación es lineal, esto es, D es un 
operador lineal sobre F[ x]. Se tienen las derivadas formales de orden superior, 
f" =D?*f, [Y = DPf, y así sucesivamente. 


Teorema S (fórmula de Taylor). ¡Sea F un cuerpo de caracteristica cero, 
c un elemento de F y n un entero positivo. Si f es un polinomio sobre f con grd f<n, 
entonces 


k 
A (Ot — o. 





f= Y 
k=0 


Demostración. La fórmula de Taylor es una consecuencia del teorema 
del binomio y la linealidad de los operadores D, D?, ..., D”. El teorema del 
binomio es fácilmente demostrable por inducción y dice que 


(a + 5)m = Y (7) ar $ 
donde k=0 
(7) - mi _mím—1)--- (m—k+1) 
k kim — k)! a E 


son los conocidos coeficientes binomiales que dan el número de combinacio- 
nes de m objetos tomados de k en k. Por el teorema del binomio 


q” = [c+ (2 — c)]” 
y (7) coak(qx — (y! 


k=0 


= "4 mo” Uzx —c) 4 +: + (—c)” 


que es la fórmula de Taylor para el caso f = x”. Si 








f = z AT” 
entonces 
Dile) = E aníDrr")(o) 
y 
SHO y 20 2 0 o) 
k=0 k m 
O o) 


Amt” 


tl 
> 3M 3M 
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Debe observarse que, puesto que los polinomios 1, (x — €), ..., (x= c) 
son linealmente independientes (véase Ejercicio 6, Sección 4.2), la fórmula 
de Taylor da el único método para escribir f como combinación de los poli- 
nomios (x — «Y, (0<k <m). 

Aunque no se den mayores detalles, es tal vez de utilidad mencionar aquí 
que, con una apropiada interpretación, la fórmula de Taylor es también válida 
para polinomios sobre cuerpos de característica finita. Si el cuerpo tiene carac- 
terística finita (la suma de un número finito de unidades de F es 0), entonces 
se puede tener que k! = 0 en F, en cuyo caso la división de (D*fX(c) por k! no 
tiene sentido. No obstante, se puede dar sentido a la división de D*f por k!, 
porque cada coeficiente de D*f es un elemento de F multiplicado por un entero 
divisible por k! Si todo esto resultase confuso, se aconseja al lector restringir 
su atención a cuerpos de caracteristica O o a subcuerpos de los números com- 
plejos. 

Si c es una raíz del polinomio f, la multiplicidad de la raíz « de f es el mayor 
entero positivo r tal que (x — cY divide a f. 

La multiplicidad de una raíz es evidentemente menor o igual al grado de f. 
Para polinomios sobre cuerpos de caracteristica cero la multiplicidad de la 
raiz c de f está relacionada con el número de derivadas de f que son nulas en c. 


Teorema 6. Sea F un cuerpo de característica cero y f un polinomio sobre 
IF econ grd f < n. Entonces el escalar « es una raíz de f de multiplicidad r si, y solo si, 


(DNc)=0, 0O<k<r-—1I 
(Dic) $ O. 


Demostración. Supóngase que r es la multiplicidad de la raíz c de f. Enton- 
ces existe un polinomio g tal que f = (x — cYg y g(c) + 0. De otro modo, f 
sería divisible por (x — cy **, por el Corolario | del Teorema 4. Por la fórmu- 
la de Taylor aplicada a g 


¡=-o 742 06 - or] 


- “y sa y (a — 


Cc) +” 

no 
("omo hay solo una manera de escribir f como combinación lineal de las po- 
tencias (x — cY (0 < k < hn), se sigue que 


0OSsSiO0<k<r-—1 
(DEP (c) _ 
k! D*-"g(c) 


(k — 7)! 


Por tanto, DFf(c) = 0 para O<k<x-— 1, y D'f(c) = g(c) + O. Recípro- 
procamente, si estas condiciones se cumplen, se sigue de inmediato, por la fórmu- 
la de Taylor, que existe un polinomio g tal que f = (x — cYg y g(c) + 0. Supón- 
pase ahora que r no sea el mayor entero positivo tal que (x — cY divida a f. 
Entonces existe un polinomio h tal que f = (x — cJ*?*h. Pero ello implica 


sir<k<mnm. 
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g = (x — c)h, por el Corolario 2 del Teorema 1; luego g(c) = 0, que es una 
contradicción. | 


Definición. Sea F un cuerpo. Un ideal en F|x)] es un subespucio M de Fl x| 
tal que fg pertenece a M siempre que f esté en F|x)], y g en M. 


Ejemplo 5. Si F es un cuerpo y d es un polinomio sobre F, el conjunto 
M = dF[x], de todos los múltiplos df de d por f arbitrario en F[ x], es un ideal. 
En efecto, M no es vacío, ya que contiene a d. Si f, g pertenecen a F[x] y ce es 
un escalar, entonces 


c(df) — dy = def — y) 


pertenece a M, con lo que M es un subespacio. Finalmente, también M con- 
tiene a (df)g = d(/g). El ideal M se llama el ideal principal generado por d. 


Ejemplo 6. Sean d,,..., d, un número finito de polinomios sobre F. Enton- 
ces la suma *M de todos los subespacios d¿F[x] es un subespacio y es también 
un ideal. Para ello supóngase que p pertenezca a M. Entonces existe poli- 
nomios f,, -... f, en F[x] tal que p=d,f, +: +d,,f,. Si g es un polinomio 
arbitrario sobre FF, entonces 


pg = fig) + --- + dn(f.9) 


de modo que pg también pertenece a M. Así M es un ideal, y se dirá que M es 
el ideal generado por los polinomios d,, ..., d,. 


Ejemplo 7. Sea F un subcuerpo de los números reales y considérese el 
ideal 
M = (1 + 2)F[1] + (2? + 82 + 16)F [2]. 
Se afirma que M = F[x]. En efecto, M contiene a 
2? + 8x4 16 — x(x + 2) = 62 + 16 


y, por tanto, M contiene a 6x + 6(x + 2) = 4. Luego el polinomio escalar 1 
pertenece a M, como también todos sus múltiplos. 


Teorema 7. Si F es un cuerpo y M es un ideal no nulo de F|x), existe un 
único polinomio mónico d en E[x)] tal que M es el ideal principal generado por d. 


Demostración. Por suposición, M contiene un polinomio no nulo; entre 
todos los polinomios no nulos en M existe un polinomio d de menor grado. 
Podemos admitir que d es un polinomio mónico, pues si no se puede multipli- 
car d por un escalar para hacerlo mónico. Si f pertenece a M, el Teorema 4 
dice que f = dq + r, donde r = 0 0 grd r < grd d. Como d está en M, dq y 
f — dq = r también pertenecen a M. Como d es un elemento de M de grado 
mínimo, no se puede tener grd r < grd d, con lo que r = 0. Asi M = dF[x]. 
Si g es otro polinomio mónico tal que M = gF[ x]. entonces existen polinomios 
no nulos p, q tales que d = gp y g = dq. Con lo que d = dpq. y 


grd d = grd d+ grdp  grdqg. 
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Lucgo grd p = grd q = 0, y como d, g son mónicos, p = q = 1. Asid = g. | 


Es importante observar que en la demostración recién dada se ha usado 
cl caso especial de un hecho más general y útil; a saber, si p es un polinomio 
no nulo en un ideal M y si f es un polinomio en M que no es divisible por p, 
entonces f = pq + r, donde el «resto» r que pertenece a M, es distinto de O, 
y tiene grado menor que p. Ya se había hecho uso de esta situación en el Ejem- 
plo 7 para ver que el polinomio escalar 1 es el generador mónico del ideal con- 
siderado allí. En principio, siempre es posible encontrar el polinomio mónico 
que genera un ideal dado no nulo. En efecto, se puede obtener, al final, un poli- 
nomio en el ideal de grado minimal por un número finito de divisiones sucesivas. 


Corolario. Si p,, ..., p, son polinomios sobre el cuerpo F, no todos nulos, 
existe un único polinomio mónico d en F[x)] tal que 


(a) d pertenece ul ideal generado por Py, ..., Pn; 

(b) d divide a cada uno de los polinomios pj. 
Todo polinomio que satisface (a) y (b) necesariamente satisface a 

(c) d es divisible por todo polinomio que divide cada uno de los polinomios 
Pr «<-> Pm 


Demostración. Sea d el generador mónico del ideal 
pF lx] + --- + paF[z). 


Cada elemento de este ideal es divisible por d; así, pues, cada uno de los poli- 
nomios p, es divisible por d. Supóngase ahora que f es un polinomio que divide 
a cada uno de los polinomios p,, . . ., p,. Entonces existen polinomios g,,..., £, 
tales que p, = fg;, l < i < mn. Asimismo, como d pertenece al ideal 


pFlx] + --- + p,Fl[zl, 
existen polinomios q,, ..., q, en F[x] tal que 


d = pq *** + PnQn- 
Con lo que 
d = faq + «+ 9nQn]. 


Se ha mostrado que d es un polinomio mónico que satisface a (a), (b) y (c). Si 
d" es cualquier polinomio que satisface (a) y (b) se sigue, de (a) y de la definición 
de d, que d' es un múltiplo escalar de d y que satisface igualmente a (c). Final- 
mente, en el caso que d' sea un polinomio mónico, se tiene d' = d. | 


Definición. Si p,, ..., p, son polinomios sobre el cuerpo F, no todos nulos, 
el generador d del ideal 


pF[x] +> ++ + pnFlx] 


se llama el máximo común divisor (m.c.d.) de p,, ..., p,. Esta terminología está 
justificada por el corolario anterior. Se dice que los polinomios py, ,. ya, Pn SON 
primos relativos si su máximo común divisor es 1, o en forma equivajéWe, si el 
ideal que ellos generan es todo F|x|]. 
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Ejemplo 8. Sea C el cuerpo de los números complejos. Entonces 


(a) med. (x +2, x? 4 8x + 16) = 1 (véase Ejemplo 7). 
(b) m.c.d. ((x — 2 x + 1), (e + 2) + 1)) = (x — 2Xx + ¿). En efec- 
to, el ideal 


(2 — 2Ux + YFlx] + (z — 2) (2? 4 19F [2] 
contiene a 
(1 — DAr+ 2) — (2 — (a? + 1) = (2 — 2)(x 4 2)( — 2). 
Luego contiene a (x — 2)(x + ¿), que es mónico y divide a 
YA + y (2)? +1). 


Ejemplo 9. Sea F el cuerpo de los números racionales y en F|[x] sea M el 
ideal generado por 


(1-D1+2) (14 2)Uz — 3), y (xr — 3). 
Entonces M contiene a 
¿(1 + 2)[(x — 1) — (1 — 3)] = (1 + 2)? 
y como 
(1 + 2? = (2 — 3NMz + 7) — 17 
M contiene al polinomio escalar 1. Así M = F[x] y los polinomios 
(r— D(+2) (14 2)Ux — 3), y (x — 3) 


son primos relativos. 


Ejercicios 


l. Sea Q el cuerpo de los números racionales. Determinar cuáles de los siguientes subcon- 
juntos de O[x] son ideales. Cuando el conjunto es un ideal, encontrar su generador mónico. 
(a) todos los f de grado par; 
(b) todos los f de grado >S; 
(c) todos los f tales que f(0) = 0; 
(d) todos los f tales que f(2) = f(4) = 0; 
(e) todos los f en la imagen del operador lineal 7 definido por 


T S cat) = 3 —— git, 
Lo ¿=0? 71 1 


2. Encontrar el m.c.d. de cada uno de los siguientes pares de polinomios 


(a) 225 — ai — 3x2 — 6x + 4, 121 + ai — 2a?-— 22 -— 2; 
(b) 311 + 812? — 3, 49 + 21? + 32 + 6: 
(0) 2t— 218 — 22? — 22-— 3, 14 + 6224 71 +1. 


3. Sea A una matriz n x n sobre el cuerpo F. Demostrar que el conjunto de todos los poli- 
nomios f en F[x], tales que f(4) = 0, es un ideal. 
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4. Sca F un subcuerpo de los números complejos y sea 


1 =3) 
A = . 
Lo 3 

Incontrar el generador mónico de ideal de todos los polinomios f en F[x] tales que 
NA) =0. 
5. PSea F un cuerpo. Demostrar que la intersección de cualquier número de ideales en 
IF[x] es un ideal. 
b. Sea F un cuerpo. Demostrar que el ideal generado por un número finito de polinomios 
fi. -.., f, en F[x] es la intersección de todos los ideales que contienen a f,, ..., f. 


7. Sea K un subcuerpo de un cuerpo F y supóngase que f, g son polinomios en K[x]. Sea 
M, el ideal generado por f y g en K[x] y M, el ideal que ellos generan en F[x]. Demos- 
trar que M, y Mp tienen el mismo generador mónico. 


4.5. Factorización prima de un polinomio 


En esta sección se demostrará que cada polinomio sobre un cuerpo F puede 
escribirse como producto de polinomios «primos». Esta factorización propor- 
ciona un instrumento eficaz para encontrar el máximo común divisor de un 
número finito de polinomios, y en particular suministra un recurso efectivo 
para decidir cuándo los polinomios son primos relativos. 


Definición. Sea F un cuerpo. Un polinomio f de F|[x)] se dice reducible sobre 
F si existen polinomios g, h en F[x| de grado >1 tales que f = gh, y si no, se dice 
que es irreducible sobre F. Un polinomio no escalar irreducible sobre F se llama 
polinomio primo sobre F' y a veces se dice solamente que es primo en F[x]. 


Ejemplo 10. El polinomio x? + 1 es reducible sobre el cuerpo C de los nú- 
meros complejos. En efecto, 
224 1=(2+ Dí — 1) 
y los polinomios x + ¿, x — i pertenecen a C[x]. Por otra parte, x? + 1 es 
irreducible sobre el cuerpo R de los números reales. Pues si 


224 1= (ax + ba'x + 0”) 
con a, a”, b, b' en R, entonces 
aa! = 1, ab” + ba! = 0, bb” = 1. 
listas relaciones implican que a? + b? = 0, lo que es imposible con números 


rcales a y b, a menos que a = b=0. 


Teorema 8. Sean p, f y g polinomios sobre el cuerpo F. Supóngase que p 
es un polinomio primo y que p divide al producto fe. Entonces p divide a f, o p di- 
vide a g. 


Demostración. No se pierde generalidad si se supone que p es un polinomio 
primo mónico. El hecho de ser p primo simplemente dice que los únicos divi- 
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sores mónicos de p son 1 y p. Sea d el m.c.d. de f y p. Entonces, d = lod =p, 
ya que d es un polinomio mónico que divide a p. Si d = p. entonces p divide 
a f, con lo que se habrá demostrado el teorema. Supóngase entonces que d = l, 
es decir, supóngase que f y p son primos relativos. Se demostrará que p divide 
a g. Como (f, p) = 1, existen polinomios f, y po tales que 1 = ff + pop. Mul- 
tiplicando por g, se tiene 


g = fofg + popg 
= (ff + plpog)- 


Como p divide a fg, divide también a (fg)/, y. ciertamente, p divide p(pog) 
Con lo que p divide a g. |] 


Corolarío. Sí p es un primo y divide a un producto f, : -- f,. entonces p di 
vide a uno de los polinomios f,, .... f,. 


* Demostración. La demostración es por inducción. Cuando n» = 2, la afirma- 
ción no es más que el Teorema 6. Supóngase que se ha demostrado el corolario 


para n = k y que p divide al producto f,. .... fh+1 de ciertos (k + 1) poli: 
nomios. Como p divide a (f, :** fidMi= 1. p divide a h,,,0pdividea f, :**/ 
Por la hipótesis inductiva, si p divide a f, : -- f,. entonces p divide a f; para 


algún j, 1 < ¡ < k. Con lo que se ve que en cualquier caso p debe dividir algún 
f. 1S<K+I1. |] 


Teorema 9, Si F es un cuerpo, un polinomio mónico no escalar en Fx] 
puede descomponerse en producto de primos mónicos en F|x)] de una manera 
única, salta en lo que respecta al orden. 


Demostración. Supóngase que f sea un polinomio mónico no escalar so- 
bre F. Como los polinomios de grado uno son irreducibles. nada hay que demos: 
trar si grd f = l. Supóngase que f tiene grado » > 1. Por inducción se supone 
que el teorema es válido para todo polinomio mónico no escalar de grado menor 
que ». Si f es irreducible está ya factorizado como un producto de primos mó: 
NICOS, v en caso contrario f = gh, donde g y h son polinomios mónicos no 
escalares de grado menor que ». Con lo que g y ?/ pueden ser factorizados en 
producto de primos mónicos en F[ x] y. por tanto, también f. Ahora supón- 
gase que 


f =P: Pm =Q-:**Qn 


donde P;....+PmY 91. + - - + Gn SON primos mónicos de F[ x]. Entonces p,, divide 
al producto q, * * * qn. Por el corolario anterior, p,, debe dividir á algún q,, Como 
q; Y P, son ambos primos mónicos, ello quiere decir que 


(4-16) Qi = Pm- 


Por (4-16) se ve que m=mn=<=1sim=10m= 1. En efecto, 


grad f = E grad pi = 2 grad q; 
et J= 
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ln este caso no hay más que demostrar, así que se puede suponer que m > 1 
y a >» 1, Reordenando los q se puede suponer entonces que p,, = q, y que 


P1 *** Pm-IPm = Q1 *** Qn—1Pm- 


Ahora por el Corolario 2 del Teorema 1, se sigue que 
P1*** Pm = Q1 1"? Qn-a- 


( omo el polinomio Pp; *** Pm-1 tiene grado menor que n, nuestra hipótesis 
muuctiva es válida y muestra que la sucesión q,, . .., q,-, es a lo más un reor- 
denamiento de la sucesión p,, ..., Pm-1- Esto, Junto con (4-16), muestra que 
la factorización de f como producto de primos mónicos es única, salvo en lo 
ne respecta al orden de los factores. | 


Ein la antedicha factorización de un polinomio no escalar f dado, algunos 
dle los factores mónicos pueden estar repetidos. S1 p;, Pp», .. ., p, son los primos 
mónicos distintos que aparecen en esta factorización de f, entonces 


(4-17) f = pip2 * + pr, 


niendo el exponente n, el número de veces que el primo p, aparece en la factoriza- 
ción. Esta descomposición es también, obviamente, única, y se llama la descom- 
pusición prima de f. Es de fácil verificación que cada divisor mónico de f tiene 
la forma 


(4-18) PUPZ «pr, 0O<m¡< nm, 


De (4-18) se sigue con que el m.c.d. de un número finito de polinomios mónicos 
no escalares f,, ..., f, se obtiene por combinación de todos aquellos primos 
hiónicos que aparecen simultáneamente en la factorización de f,, ..., f.. El 
exponente con que debe tomarse cada primo es el mayor al que la correspon- 
diente potencia prima es factor de cada f;. Si ninguna potencia prima (no trivial) 
es factor de cada f;, los polinomios son primos relativos. 


Ejemplo 11. Supóngase que FF es un cuerpo y sean a, b, c elementos dis- 
tintos de F. Entonces los polinomios x — a, x — b, x — c son primos mónicos 
distintos en F[x]. Si m, n y s son enteros positivos, (x — c)' es el m.c.d. de los 
polinomios 


(x—bix—=cr y (1 ajr(x— o)" 
mientras que los tres polinomios 
(x — b)r(x — c)*, (x — ajr(z — oy", (zx — a)r(x — b)” 
son primos relativos. 
Teorema 10. Sea f un polinomio mónico no escalar sobre el cuerpo F y sea 
=p mm 


la factorización prima de f. Para todo j, 1 < ¡< k, sea 


f = fp = M pj. 
+j 
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Entonces fi, ..., f, son primos relativos. 


Demostración. Se deja esta demostración (muy fácil) para el lector. Se 
ha enunciado en detalle este teorema, porque se hará referencia a él más ade- 
lante. | 


Teorema 11. Sea f un polinomio sobre el cuerpo F con derivada f”. Enton- 
ces f es un producto de polinomios irreducibles distintos sobre E si, y solo si, f y 
ff" som primos relativos. 


Demostración. Supóngase que en la factorización prima de f sobre el 
cuerpo F algún polinomio primo p (no escalar) está repetido. Entonces f = p?*h 
para algún h en F[x]. Entonces 


f' = pH + 2pp'h 
y p es también un divisor de f”. Luego f y f' no son primos relativos. 


Supóngase ahora que f = p,:: Pi, donde p,, ..., ps son polinomios 
irreducibles no escalares distintos sobre F. Sea f; = f/p;. Entonces 


f = pifi + poe + --- + pifr. 


Sea p un polinomio primo que divide a f y a f”. Entonces p = p, para algún ¿. 
Ahora como p, divide a f; para j + í. y como p, también divide a 


k 
f = 2 pS, 
I=) 


se ve que p; debe dividir p;f. Por tanto, p, divide a fo a p;. Pero p, no divide 
a f,, pues los p,, ..., p, son distintos. Asi p, divide a p;. Ello no es posible, pues 
p; tiene un grado menor que el grado de p;,. Concluimos que ningún primo di- 
vide a f ya f”, o que f y f' son primos relativos. |] 


Definición. El cuerpo F se llama algebraicamente cerrado si todo polinomio 
primo sobre F tiene grado 1. 


Para decir que F es algebraicamente cerrado, todo polinomio mónico irredu- 
cible no escalar sobre F' debe ser de la forma (x — c). Ya hemos observado 
ue todo polinomio de éstos es irreducible para cualquier F. En consecuencia, 
una definición equivalente de un cuerpo algebraicamente cerrado es la de cuer- 
po F tal que cada polinomio no escalar f en F[x] puede ser expresado en la 
forma 

Íf = clx — CJ" --- (1 — C;)" 


donde c es un escalar, €,, ..., e, son elementos distintos de F, y n,, ..., n, son 
enteros positivos. Otra formulación es que si f es un polinomio no escalar sobre 
F, entonces existe un elemento c en F tal que f(c) = 0. 

El cuerpo R de los números reales no es algebraicamente cerrado, pues el 
polinomio (x? + 1) es irreducible sobre R, pero no es de grado 1, o porque 
no existe número real c tal que c? + 1 = 0. El llamado teorema fundamental 
del álgebra dice que el cuerpo C de los números complejos es algebraicamente 
cerrado. No se demostrará este teorema; sin embargo, se lo usará más adelante 
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en este libro. La demostración se omite, en parte, por limitación de espacio 
y, en parte, porque la demostración depende de una propiedad «no algebraica» 
del sistema de los números reales. Para una posible demostración, el lector 
interesado puede consultar el libro de Schreier y Sperner en la bibliografía. 

El teorema fundamental del álgebra también explica cuáles son las posibi- 
lidades de factorización prima de un polinomio con coeficientes reales. Si f es 
un polinomio con coeficientes reales y c es una raíz compleja de f, entonces la 
compleja conjugada ¿ es también una raíz de f. Por tanto, aquellas raíces com- 
plejas que no son reales deben aparecer en pares conjugados y el conjunto en- 
tero de raíces tiene la forma [f,, ..., ty, C1, Ep, +...» Ep, Ey), donde f,,..., t; 
son reales y C,, ..., e, son números complejos no reales. Con lo que f se des- 
compone en la forma 


$ = clx — ti) -+- (z— ti) --: pr 
donde p, es el polinomio cuadrático 
Pi = (z — cs) (zx — Cs). 


Estos polinomios p, tienen coeficientes reales. Concluimos que todo polinomio 
irreducible sobre el cuerpo de los números reales tiene grado 1 o 2. Todo po- 
linomio sobre R es el producto de ciertos factores lineales obtenidos de las 
raíces reales de f y ciertos polinomios cuadráticos irreducibles. 


Ejercicios 


l. Sea p un polinomio mónico sobre el cuerpo F y sean f y g polinomios primos relativos 
sobre F. Demostrar que el m.c.d. de pf y pg es p. 


2. Suponiendo demostrado el teorema fundamental del álgebra, demostrar lo siguiente. 
Si f y g son polinomios sobre el cuerpo de los complejos. entonces el m.c.d. (f, g) = 1 si. 
y solo si, f y g no tienen raíces en común. 


3. Sea D el operador de la derivación en el espacio de los polinomios sobre el cuerpo de 
los números complejos. Sea f un polinomio mónico sobre el cuerpo de los números com- 
plejos. Demostrar que 


f = (1 —c1) --- (x — cr) 


donde C,, ..., C¿ son números complejos distintos si, y solo si, f y Df son primos relativos. 
En otras palabras, f no tiene raíces repetidas sino si, y solo si, f y Df no tienen raices co- 
munes. (Supóngase el teorema fundamental del álgebra.) 


4. Demostrar la siguiente generalización de la fórmula de Taylor. Sean f, g y hA polinomios 
sobre un subcuerpo de los números complejos, con grd f < n. Entonces 
n 
10) = E SUM 
k=0K! 

(Aqui f(g) representa «f de g».) 

Para el resto de los ejercicios se necesita la siguiente definición. Si f, g y p son polino- 
mios sobre el cuerpo F' con p H 0, se dice que f es congruente con g módulo p si (f — g) es 
divisible por p. Si f es congruente con g módulo p, se escribe 


f = g mód p. 
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5. Demostrar que para todo polinomio no nulo p, la congruencia niódulo p es una re- 
lación de equivalencia. Es decrr: 

(a) Es reflexiva; f = f mód p. 

(b) Es simétrica; si f = g mód p, entonces g = f mód p. 

(c) Es transitiva; si f = g mód p y g = h mód p, entonces f = h mód p. 
6. Supóngase que f = g mód p y f, = £g, mód p. 

(a) Demostrar que f + f, = g + £, mód p. 

(b) Demostrar que ff, = gg, mód p. 
7. Usando el Ejercicio 7, demostrar lo que sigue. Si f, g, k y p son polinomios sobre cel 
cuerpo FypF0 ysi f = g mód p, entonces Hf) = h(g) mód p. 


8. Si p es un polinomio irreducible y fe = 0 mód p, demostrar que f = 0 mód po 
g = 0 mód p. Dar un ejemplo que muestre que esto es falso si p no es irreducible. 


5. Determinantes 


5.1. Anillos conmutativos 


En este capitulo demostraremos lo más esencial sobre determinantes de 
matrices cuadradas. Haremos esto no solo para matrices sobre un cuerpo, 
simo también para matrices con elementos que son «escalares» de un tipo más 
general. Hay dos razones para esta generalidad. Primera, en algunos puntos 
del capítulo siguiente tendremos que usar determinantes de matrices con poli- 
nomios como elementos. Segunda, en el tratamiento de los determinantes que 
presentaremos no interviene el axioma de los cuerpos que garantiza un inverso 
multiplicativo para cada elemento no nulo. Por estas razones es apropiado 
desarrollar la teoría de los determinantes de las matrices cuyos elementos per- 
tenecen a un anillo conmutativo con unidad. 


Definición. Un anillo es un conjunto K, junto con dos operaciones 
(x, Y) x+)yydx y)>x que satisfacen: 


(a) K es un grupo conmutativo para la operación (x, y)=>x + y (K es gru- 
po aditivo conmutativo); 

(b) (xy)z = x(yz) (la multiplicación es asociativa); 

(0) x(rp + 2)=xy +x2; (y + zx = yx + zx (se cumplen las dos leyes 
distributivas). 

Si xv = yx para todo x e y de K, se dice que el anillo es conmutativo. Si existe 
un elemento 1 en K tal que 1x = x1l = x para todo x, se dice que K es un anillo 
con unidad, y 1 es la unidad de K. 


Se trata aquí de anillos conmutativos con unidad. Tales anillos pueden 
ser descritos brevemente como un conjunto K, junto con dos operaciones que 
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cumplen todos los axiomas de cuerpo dados en el Capítulo 1, excepto posi- 
blemente el axioma (8) y la condición 1 + 0. Así, un cuerpo es un anillo con- 
mutativo con unidad distinta de cero en que a cada x distinto de O (cero) le 
corresponde un elemento x”* tal que xx”* = 1. El conjunto de los enteros, 
con las operaciones corrientes, es un anillo conmutativo con unidad que no 
es un cuerpo. Otro anillo conmutativo con unidad es el conjunto de todos los 
polinomios sobre un cuerpo, junto con la adición y multiplicación que se han 
definido para los polinomios. 

Si K es un anillo conmutativo con unidad, se define una matriz m x n sobre 
K como una función A del conjunto de los pares (i, j) de enteros, l < ¡< m, 
l<j<n, en K. Como es usual, se representará una tal matriz por una dis- 
posición rectangular que tiene m filas y n columnas. La suma y el producto 
de matrices sobre K se definen igual que para las matrices sobre un cuerpo 


(A + B)s = As; + B,; 
(AB)i = z AuBr; 


estando definida la suma cuando A y B tienen el mismo número de filas y el 
mismo número de columnas, y el producto cuando el número de columnas 
de A es igual al número de filas de B. Las propiedades algebraicas básicas de 
estas operaciones son también válidas. Por ejemplo, 


A(BB+C)=ABH+AC, —(AB)JIC = A(BO), etc. 


Como en el caso de los cuerpos, nos referiremos a los elementos de K como 
escalares. Podemos definir entonces combinaciones lineales de las filas o co- 
lumnas de la matriz como ya se hizo antes. En general, todo lo que previamente 
se hizo para las matrices sobre un cuerpo es válido para matrices sobre K, ex- 
cluyendo aquellos resultados que dependen de'la posibilidad de «dividir» en K. 


5.2. Funciones determinantes 


Sea 'K un anillo conmutativo con unidad. Vamos a asignar a cada matriz 
n x n (cuadrada) sobre K un escalar (elemento de K) llamado determinante 
de la matriz. Es posible definir el determinante de una matriz cuadrada A es- 
cribiendo simplemente una fórmula para este determinante en términos de los 
elementos de A. Se puede entonces deducir las diversas propiedades de los de- 
terminantes partiendo de esta fórmula. Sin embargo, tal fórmula es bastante 
complicada y, para ganar algunas ventajas técnicas, se procederá como sigue. 
Se definirá una «función determinante» en K"*" como una función que asigna 
a cada matriz n x n un escalar sobre K, función que tiene estas propiedades 
especiales: es lineal como función de cada una de las filas de la matriz; su valor 
es O sobre toda matriz que tenga dos filas iguales y su valor sobre la matriz iden- 
tidad n x nes 1. Se demostrará que tal función existe, y que es única, es decir, 
que existe exactamente una función así. Cuando demostremos la unicidad, 
obtendremos una fórmula explícita para el determinante junto con muchas 
de sus propiedades. 
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Esta sección se dedicará a la definición de la «función determinante» y a 
li demostración de que existe al menos una función semejante. 


Definición. Sea K un anillo conmutativo con unidad, n un entero positivo 
y sea D una función que asigna a cada matriz n x n sobre K un escalar D(A) 
en K. Se dice que D es n-lineal si para cada i, 1 < ¡< n, D es una función lineal 
de la ¡ésima fila cuando las otras (n — 1) filas se dejan fijas. 


Esta definición requiere cierta explicación. Si D es una función de K”*" 
cn K, y si %,,..., 0, son las filas de la matriz A, se puede escribir también 


D(A) = Díoar, . . . 0) 


esto es, se puede también considerar D como la función de las filas de 4. La 
afirmación de que D es n-lineal quiere decir entonces que 


(5-1) Día, ...,cas + 0%, ...,0n) =cDlo, ...,05, +. . , An) 
+ Dlor,...,0t..., Qn). 


Si se fijan todas las filas, excepto la fila ¿, y se considera D como función de la 
fila í, es a veces conveniente escribir D(a,) por D(A4). Así (5-1) puede abreviar- 
se como 


Dí(ca; + a1) = cDlas) + Dlas) 


siempre que quede claro su significado. 


Ejemplo 1. Sean k,, ..., k, enteros positivos, l < k; < n, y sea a un 
elemento de K. Para toda matriz nx n, A, sobre K, se define 
(5-2) D(A) = aA(1, k) --- Al(n, k,). 


Entonces la función D definida por (5-2) es n-lineal. En efecto, si se conside- 
ra D como función de la fila ¡| dejando fijas las otras, se puede escribir 


Das) = A(z, k;)b 
donde hb es un elemento fijo de K. Sea a, = (Aj, ..., Ain). Entonces se tiene 


D(ca, + a;2) 


[cA(i, k;) + A*(t, k;)]b 
cD(a;) + D(a:). 


Con lo que D es una función lineal de cada una de las filas de A. 
Una función n-lineal particular de este tipo es 


D(A) = AnÁAo ... Ánn. 


Es decir, el «producto de los elementos de la diagonal» es una función n-lineal 
sobre K"”*”. 


Ejemplo 2. Se definen todas las funciones 2-lineales sobre las matrices 
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2 x 2 sobre K. Sea D tal función. Si se representan las filas de la matriz 2 x 2 
por €;,, €, se tiene 


D(A) = D(Ane + Á 1262, Áne + A 972). 
Utilizando que D es 2-lineal, por (5-1), se tiene 


D(A) = AuD(e, Asier + Age) + AnDíle, Asier + Are) 
= AnArD(e, e) + AnAsD(e,, €2) 
+ ArAnDles, e1) + AnA2Dlez, €2). 


Con lo que D está completamente determinado por los cuatro escalares 


D(a, €), D(e, €2), D(es, e), y D(ez, €2). 


El lector fácilmente podrá verificar lo que sigue. Si a, b, c, d son cuatro esca- 
lares cualesquiera de K y si se define 


D(A) = Ajdaua + AnAmb + ArÁnc + ÁnA sd 
entonces D es una función 2-lineal de las matrices 2 x 2 sobre K y 
De, e) = a, D(e, €) = bd 
De, €) =C, D(e2, €) = d. 
Lema. Una combinación lineal de funciones n-lineales es n-lineal. 


Demostración. Basta demostrar que una combinación lineal de dos fun- 
ciones n-lineales es n-lineal. Sean D y E funciones n-lineales. Si a y b pertene- 
cen a K, la combinación lineal aD + bE está definida por 


(aD + DEN(A) = aD(A) + bE(A). 
Luego si fijamos todas las filas, excepto la fila ¿, 


(aD + dE)(ca; + a) = aDíca; + a) + dbElca; + 01) 
= acDla;) + aDías) + beE(as) + bElas) 
= c(aD + bENa) + (aD + dE)Nai). | 


S1 K es un cuerpo y V es el conjunto de las matrices n x n, el lema anterior 
dice lo siguiente: El conjunto de las funciones n-lineales en Y es un subespacio 
del espacio de todas las funciones de V en K. 


Ejemplo 3. Sea D la función definida sobre las matrices 2 x 2 sobre K por 
(5-3) D(A) = AnA2a2 — Arda. 


Ahora bien, D es la suma de dos funciones del tipo descrito en el Ejemplo 1: 
D = D, + Ds, 
D¡(A) = Au4oaz 
D.(A) = —AvnvAsr. 


Por el lema anterior, D es una función 2-lineal. El lector que haya tenido alguna 
experiencia con los determinantes, no se sorprenderá de este resultado, ya que 
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reconocerá en (5-3) la definición corriente del determinante de la matriz 2 x 2. 
Claro que la función D que se ha definido no es una función 2-lineal típica. Tiene 
varias propiedades especiales. Anotemos algunas de ellas. Primero, si 7 es la 
matriz identidad 2 x 2, entonces D(7) = 1, es decir, D(€,, €,) = 1. Segundo, 
si dos filas de A son iguales, entonces 


D(A) = AnÁAr — ÁAvÁn = O. 


Tercero, si A* es la matriz que se obtiene de la matriz 2 x 2, A, intercambiando 
filas, entonces D(4”%) = —D(A); en efecto, 


D(A”) = A11422 — AñrÁAz2 
= AnÁr —_ AzÁxn 
—D(A). 


Definición. Sea D una función n-lineal. Se dice que D es alternada si se 
cumplen las siguientes dos condiciones : 


(a) D(A) = 0 cuando dos filas de A son iguales. 
(b) Si A' es una matriz que se obtiene intercambiando dos filas de A, en- 
tonces D(AY = — DÍA). 


Demostraremos más adelante que toda función n-lineal D que cumple (a), 
automáticamente cumple (b). Hemos puesto las dos condiciones en la defini- 
ción n-lineal alternada por razones de conveniencia. El lector probablemente 
observará que si D satisface (b) y A es una matriz con dos filas iguales, entonces 
D(A) = — D(4). Es tentador concluir que D satisface también la condición (a). 
Esto es cierto, por ejemplo, si K es un cuerpo en el que 1 + 1 4H 0, pero en ge- 
neral (a) no es consecuencia de (b). 


Definición. Sea K un anillo conmutativo con unidad y seu n un entero posi- 
tivo. Supóngase que D es una función de matrices n x n sobre K en K. Decimos 
que D es una función determinante si D es n-lineal, alternada, y si D(L) = 1. 


Como dijimos antes, mostraremos finalmente que existe exactamente una 
función determinante sobre matrices n x n sobre K. Ello se ve fácilmente para 
las matrices 1 x 1, A = [a], sobre K. La función D dada por D(4) = a es una 
función determinante y, evidentemente, es la única función determinante de 
las matrices 1 x 1. Estamos, pues, en condiciones de considerar el caso para 
n = 2. La función 


D(A) = Anda — AnÁn 


es una función determinante, como se vio en el Ejemplo 3. Además, la fórmula 
encontrada en el Ejemplo 2 muestra que D es la única función determinante 
sobre las matrices 2 x 2. En efecto, se vio que para cualquier función 2-lineal D 


D(A) = AnAnD(e,, e) + AnáAD(er, €2) 
+ AnAnDíle, e) + Ar ADlez, €2). 
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Si D es alternada, entonces 


D(e, €1) = Dlez, ee) = 0 


D(e», €) = — Der, ee) = —D(). 
Si D satisface también D(7) = 1, entonces 
D(A) = An4A» — ÁAnAdaa. 


Ejemplo 4. Sea F un cuerpo y sea D cualquier función 3-lineal y alternada 
de las matrices 3 x 3 sobre el anillo de polinomios F[x]. 


Sea 
zx O —2 
Á = E 1 0 | 
1 0 q? 


Si designamos las filas de la matriz identidad 3 x 3 por €;,, €,, €,, entonces 
D(A) = Dízta — 2%, €2, € + T%5). 
Puesto que D es lineal como función de cada fila, 


D(A) = aD(e, €, € + xdez) — x?D(es, e, a + ade) 
= xD(e, €, €1) + uiD(e, €2, €) — 1?D(63, €2, €1) — 1 D(E3, €2, €). 


Puesto que D es alternada, se sigue que 
D(A) = (1* + 23D(e,, e2, €s). 


Lema. Sea D una función 2-lineal con la propiedad de que D(A) = O para 
todas las matrices 2 x 2, A, sobre K que tienen filas iguales. Entonces D es al- 
ternada. 


Demostración. Lo que hay que demostrar es que si Á es una matriz 2 x 2 
y si A' se obtiene intercambiando las filas de A, entonces D(4”) = —D(A). 
Si las filas de A son a y f, ello quiere decir que se debe demostrar que D(f, a) = 
—Dl(a, f). Como D es 2-lineal, 


D(a + 6, a + B) = D(a, a) + D(a, B) + D(6, a) + D(B, B). 
Por la hipótesis, D(a + fB, a + fP) = Día, a) = D(f, PB) = 0. Luego 
0 = D(a, 6) + D(6, a). | 


Lema. Sea D una función n-lineal de las matrices n x n sobre K. Supón- 
gase que D tiene la propiedad de que D(A) = 0, siempre que dos filas adyacentes 
de A sean iguales. Entonces D es alternada. 


Demostración. Debe demostrarse que D(4) = O cuando dos filas cuales- 
quiera de A son iguales, y que D(4') = — D(A) si A' se obtiene por intercambio 
de dos filas de A. Primero supóngase que 4” se obtiene por intercambio de dos 
filas adyacentes de 4. El lector verá que el razonamiento dado en la demostra- 
ción del lema anterior se extiende al presente caso y da D(4') = — D(A). 
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Ahora sea B obtenida por intercambio de dos filas ¡ y ¡ de A, con i < j. Se 
puede obtener B de A por medio de una sucesión de intercambios de pares de 
filas adyacentes. Se comienza intercambiando la fila ¿ con la fila (¿ + 1) y con- 
tinuando hasta que las filas queden en el orden 


Ol) +. .) Os) Orly > > > y Oj, Qiy Oj4ly >» » y Ono 


listo requiere k = ¡ — i intercambios de filas adyacentes. Se mueve ahora a, a 
la posición ¿ haciendo (k — 1) intercambios de filas adyacentes. Se obtiene 
así B a partir de 4 por k + (k — 1) = 2k — 1 intercambios de filas adyacen- 
tes. Con lo que 


D(B) = (—D*D(4) = —D(4). 


Supóngase que A es cualquier matriz n x n con dos filas iguales, digamos a,=0,, 
con i< j.Sij= ¿+ l, entonces A tiene dos filas adyacentes iguales y D(4) = 0. 
Sij> ¡+ 1, se intercambian Q,,, y a, y la matriz resultante B tiene dos filas 
adyacentes iguales, entonces D(B) = 0. Por otro lado, D(B) = — D(A), luego 
D(4)=0. | 


Definición. Sin > 1 y A es una matriz n x n sobre K, designemos por A(i|j) 
la matriz (n — 1) x (n — 1) que se obtiene eliminando la i-ésima fila y la j-ésima 
columna de A. Si D es una función (n — 1)-lineal y A es una matriz n x n, se 
hace D¡(A) = D[A(|7)]. 


Teorema 1. Sea n > 1 y sea D una función (n — 1ylineal alternada de las 
matrices (n — 1) x (n — 1) sobre K. Para todo j, 1 <j<mn, la función E, de- 
finida por 


(5-4) E(4) = E. (-1NYA¿D,(A) 
i=1 


es una función n-lineal alternada de las matrices n Xx n, A. Si D es una función 
determinante, también lo es E). 


Demostración. Si A es una matriz n x n, D,¡(A) es independiente de la 
lila ¿ de A. Como D es (n — 1plineal, es claro que D,, es lineal como 
función de cualquier fila, excepto la fila ¿. Por tanto, A,¡D,¡(A) es una fun- 
ción n-lineal de 4. Una combinación lineal de funciones n-lineal es n-lineal; 
luego E, es n-lineal. Para demostrar que E), es alternada bastará demostrar 
que E,(4) = O siempre que A tenga dos filas iguales. Supóngase que 0, = 04 1- 
Sii4tkyi¿k<+ 1, la matriz A(i|/) tiene dos filas iguales, y así D,¡(4) = 0. 
Por tanto, 


ESA) = (TIPA LD A) + (—DAFHA miDoernilA). 
Como Xx = Ok + 1> 
Ay = Áaws y  A(lj) = A(k + 1/7). 


Entonces es claro que E;(4) = Ó. 


Supóngase ahora que D es una función determinante. Si /” es la matriz 


146 Aleebro lincal 


identidad n x n, entonces I“W(¡|j) es la matriz identidad (n — 1) x (n — 1), 
["=DB_ Como IfF' = 6,,, se sigue de (5-4) que 


(5-5) E¡(1W) = DD), 
Ahora, D(I"" )= 1, de donde E;(1) =1 y E; es una función determinante. |] 


Corolario. Sea K un anillo conmutativo con unidad, y sea n un entero posi- 
tivo. Existe al menos una función determinante sobre K"*”. 


Demostración. Se ha demostrado la existencia de una función determi- 
nante sobre matrices 1 x 1 sobre K y también sobre matrices 2 x 2 sobre K. 
El Teorema 1 dice explícitamente cómo construir una función determinante 
sobre matrices n x nm, dada tal función sobre matrices (nm — 1) x (n — 1). El 
corolario se demuestra por inducción. |] 


Ejemplo S. Si B es una matriz 2 x 2 sobre K, sea 
[B| = BB» — BB». 


Entonces |B| = D(B), donde D es la función determinante sobre las matrices 


2 x 2. Hemos mostrado que esta función sobre K**? es única. Sea 


Án Áyo Án 
Á = Ána Án Án 
Áx Ág As 


una matriz 3 x 3 sobre K. Si se define E,, E,, E, como en (5-4), entonces 


























_ An Axl y, |án As q Áx 

(5-6) E(A)= Aun As As Áa As 40 + Ama Az 
An Az Án Áx As Áx 

SN AE PA E A 
_ Án Án _ Au Áxn Au Áx 

6 HO = Aaa, al lAs Al lA Al 




















Se sigue del Teorema 1 que E,, E,, E, son funciones determinantes. En reali- 
dad, como se verá más adelante, E, = E, = E,, pero esto no se ve, incluso 
en este caso sencillo. Se podria, sin embargo, comprobar en forma directa desarro- 
llando cada una de las expresiones anteriores. En vez de hacerlo se dan algunos 
ejemplos concretos. 


(a) Sea K = R[x], y 


Determinantes 147 


l'ntonces 





























, z—2 1 
EA) =(2=DP] Lg = DE 2-3) 
_ O 1 z=1 2 
Ea) = o ¿gt a—2 0 2-3 
= (1 — 1)(x — 2(x — 3) 
y 
_ ¿0 2-2 jre—1 2? _apel 2 
EXA) == y o opFETNM Oo ¿2 
= (2 — D)(x — 2(x — 3). 
(b) Sea K= R y 01.0 
A=|0 O 1|¿ 
10.0 
I:ntonces 1 0 
Ea) = li 1 
EA) = —|y o =1 
ESA) = —|; > 
Ejercicios 


Í. Cada una de las siguientes expresiones define una función D sobre el conjunto de las 
matrices 3 x 3 sobre el cuerpo de los números reales. ¿En qué casos es D una función 
1-Imeal? 

(a) D(A) = Au + 4 + Au; 

(b) D(A) = (An)? + 34142; 

(c) D(A) = AnAnAas; 

(d) D(A) = AuyAnAz + 5AnAnmdAgz; 

(e) D(A) = 0; 

(1D) D(A) = 1. 
2. Verificar directamente que las tres funciones E,, E,, E, definidas por (5-6), (5-7) y (5-8) 
son idénticas. 


Y. Sea K un anillo conmutativo con unidad. S1 A es una matriz 2 x 2 sobre K, la adjunta 
du A es la matriz 2 x 2, adj A, definida por 
. A ar] 
adj A = . 
) Az An 
$ det representa la función determinante única de las matrices 2 x 2 sobre K, demos- 
tar que 
(a) (adj 4)4 = A(adj] 4) = (det MI; 
(b) det (adj A) = det (A); 
(c) adj (45) = (adj A)". 


(1 denota la transpuesta de 4.) 
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4. Sea A una matriz 2 x 2 sobre un cuerpo F. Demostrar que A es inversible si, y solo si, 
det 4 + 0. Si A es inversible, dar una fórmula para 47?. 


5. Sea A una matriz 2 x 2 sobre un cuerpo F y supóngase que 4? = 0. Demostrar que 
para todo escalar c, det (c! — A) = e?. 


6. Sea K un subcuerpo de los números complejos y n un entero positivo. Sean j;. ..../, 
y Ki, ..-., k, enteros positivos no mayores que n. Para una matriz n x n sobre K se define 


D(A) = Alí KDA(j2 ko) -*> A(in) Kn). 
Demostrar que D es n-lineal si, y solo si, los enteros f,, ..., j, son distintos. 


7. Sea K un anillo conmutativo con unidad. Demostrar que la función determinante 
sobre las matrices 2 x 2, A, sobre K es alternada y 2-lineal como función de las colum- 
nas de A. 


8. Sea K un anillo conmutativo con unidad. Se define una función D sobre las matrices 

3 x 3 sobre K por la regla 
Az 
Á32 


Ax Áo 


DA) = A det ha An 


ml _ 
As Ap det 


] + Áy det An sel. 


Au As2 
Demostrar que D es alternada y 3-lineal como función de las columnas de A. 


9. Sea K un anillo conmutativo con unidad y D una función alternada y n-lineal sobre 
las matrices n x n sobre K. Demostrar que 

(a) D(4) = 0 sí una de las filas es 0; 

(b) D(B) = D(A) sí B se obtiene de A por adición de un múltiplo escalar de una fila 
de A a otra. 


10. Sean F un cuerpo, A una matriz 2 x 3 sobre F y (c,, c,, c3) el vector en F* defini- 
do por 


_ Av An 


GQ = | C An Án 
1 Ao Ao J 2 


A An 


a. 
-—— 


, — 











Án A 
Aa Az 


Demostrar que 

(a) rango (4) = 2 si, y solo si, (c,, C,, €C3) + 0; 

(b) si A tiene rango 2, entonces (c,, C,, cz) es una base para el espacio de las solucio- 
nes del sistema de ecuaciones AX = 0. 


11. Sea K un anillo conmutativo con unidad y sea D una función alternada 2-lineal sobre 
las matrices 2 x 2 sobre K. Demostrar que D(4) = (det A4)D(I) para toda A. Usar este 
resultado (no son lícitos cálculos con los coeficientes) para demostrar que det (4B) = 
(det AMdet B) para cualesquiera matrices 2 x 2, A y B, sobre K. 


12. Sea F un cuerpo y D una función sobre las matrices n x n sobre F (con valores en FF), 
Supóngase que D(4B) = D(A)D(B) para todo A, B. Demostrar que D(4) = O para toda 
A, O bien D(I) = 1. En este último caso demostrar que D(4) H O sí A es inversible. 


13. Sea R el cuerpo de los números reales y sea D una función sobre las matrices 2 x 2 
sobre R, con valores en R, tales que D(AB) = D(A)D(B) para cualesquiera A, B. Supón- 


gase que, además, 
O 1 1.0 
D(Li 0J)=>(Lo 11) 
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Demostrar que 
(a) PD(0) = 0; 
(b) D(4) =0 si 4? =0; 
(c) DIAB) = — D(A) si B se obtiene por intercambio de las filas (o columnas) de A; 
(d) D(4) = 0 si una fila (o columna) de A es 0; 
(c) D(A) = 0 sí A es singular. 


14. Sea A una matriz 2 x 2 sobre el cuerpo F. Entonces el conjunto de todas las matri- 
ves de la forma f(4), donde f es un polinomio sobre FF, es un anillo conmutativo con uni- 
did K. Si B es una matriz 2 x 2 sobre K, el determinante de B es entonces una matriz 2 x 2 
sobre F, de la forma f(4). Supóngase que / es la matriz unidad 2 x 2 sobre F y que B es 
la matriz 2 x 2 sobre K 

A—Auf  —Auf | 


B = —Anl  A— Axl 


lumostrar que det B = f(4), donde f = x? — (4,, + Az,)x + det A y también que 
HA) = 0. 


$.3. Permutaciones y unicidad 
de los determinantes 


En esta sección demostraremos la unicidad de la función determinante 
sobre matrices hn x n sobre K. La demostración conducirá de una manera na- 
tural a estudiar las permutaciones y algunas de sus propiedades básicas. 

Supóngase que D es una función alternada n-lineal sobre las matrices n x n 


sobre K. Sea A una matriz n x n sobre K con filas 2,, %,, ..., A. Si se repre- 
sentan las filas de la matriz unidad n x n sobre K por €;,, €», ..., €,, entonces 
n 
(5-9) a; = 3 A(, ¿e, 1<:23<m. 
j=1 
l uego 


D(4) =D (2 A(l, j)de,, 02, -..., ca) 
3 
= 2 A(1,D(e;, 0%, - - - , An). 
J 
Si ahora se remplaza a, por * 4A(2, k)e,, se ve que 
k 


Dfe,, O)... -, Qtn) = z Á(2, KD(e,, Ek). -.;) An). 
Así, pues, 
D(A) = 2 A(1, HA, k)D(es, €, - - - , An)- 
Y» 


lin D(€;, €x, . - - , 0,) se remplaza ahora az por E 4(3, 1)e, y así sucesivamente. 
Finalmente, se obtiene una expresión complicada, pero teóricamente impor- 
tante de D(4), a saber, 

A 


(5-10)  D(4)= 
pe y AU, k,) A (2, ko») nn”. AÁ(n, Kkn)D(ex,, Ek -« - -5 Ekn)- 
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En (3-10) la suma se extiende sobre todas las sucesiones (A ,, k,, ..., k,) de cn- 
teros positivos no mayores que n. Esto demuestra que D es una suma finita 
de funciones del tipo descrito en (3-2). Debe observarse que (5-10) es una con- 
secuencia directa de la suposición de que D es n-lineal, y que un caso particular 
de (5-10) se obtuvo en el Ejemplo 2. Como D es alternada, 


Di6k:) Ek - - - > Ea). = O 


siempre que dos de los índices k, sean iguales. Una sucesión (k,, k», ..., Kn) 
de enteros positivos no mayores que n, con la propiedad de que no haya dos 
de los k;, iguales, se llama permutación de grado m. En (5-10) necesitamos, por 
tanto, sumar solamente sobre aquellas sucesiones que son permutaciones de 
grado n. 

Como una sucesión finita, O n-tuple, es una función definida sobre los pri- 
meros n enteros positivos, una permutación de grado n puede definirse como 
una función biyectiva del conjunto (1, 2,...., nj sobre sí mismo. Una tal función 
ga corresponde a un n-tuple (a,, 0), ..., 0, ) y es, por tanto, simplemente una 
regla para ordenar 1, 2, ..., n en alguna forma bien definida. 

Si D es una función alternada n-lineal y A es una matriz n x n sobre K. se 
tiene entonces 


(5-11) D(A) = 2 A(I, 01) :--- Al(n, onDíésa, . . - , €en) 


donde la stma se extiende sobre las distintas permutaciones a de grado n. 
A continuación mostraremos que 


(5-12) Dlés, .. .>-3 €sn) = 1D(a, ...) €n) 


donde el signo + depende solo de las permutaciones gd. La razón de ello es como 
sigue. La sucesión (01, 02, .. ., an) se puede obtener de la sucesión (1, 2,...,h) 
por un número finito de intercambios de los pares de elementos. Por ejemplo, 
st al + 1, se puede transponer 1 y al, obteniéndose (ol, ..., al, ...). Proce- 
diendo así se puede llegar a la sucesión (a1, ..., an) después de n o menos de 
tales intercambios de pares. Como D es alternada, el signo de su valor cambia 
cada vez que se intercambian dos de las filas €, y €;. Así, si se pasa de (1, 2,...,n) 
a (al, 02, ..., an) por medio de m intercambios de pares (i, /), se tendrá 


Dlés, ...>) €sn) = (—D)”"D(e, .. . y, €n). 


En particular, si D es una función determinante 
(5-13) Dlés, . . - , €n) = (— 1)” 


donde m depende solo de a, y no de D. Así, toda función determinante asigna 
el mismo valor a la matriz de filas €, ,, ..., €,,, y este valor es 1 o —1. 

Sea ahora el siguiente hecho básico respecto de las permutaciones. Si a es. 
una permutación de grado n, se puede pasar de la sucesión (1, 2, ...,n) a la 
sucesión (01, 02, .... an) por una sucesión de intercambios de pares, y ello 
puede hacerse de diversas maneras; pero sin que importe cómo se haya hecho, 
el número de intercambios empleados es siempre par o impar. La permutación 
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se llama entonces par o impar, respectivamente. Se define el signo de una per- 


mutación por 
1, sio es par 
Sgn o = . 
—1, si O es impar 


representando aquí el símbolo «1» el entero 1. 

Se verá más adelante que esta propiedad básica de las permutaciones se 
puede deducir de lo que ya se sabe sobre funciones determinantes. Supóngase 
por ahora que ello sea así. Entonces el entero m en (5-13) es siempre par si a es 
una permutación par, y es siempre impar si g es una permutación impar. Para 
una función alternada n-lineal se tiene entonces que 


Df, - - - , €en) = (Sgn 0)D(€, . . . , €n) 
y por (5-11) 


(5-14) D(A) = [2 (sgn o)A (1, 1) --- Al(n, on) | DU). 


Es claro que / representa la matriz identidad n x n. 
De (5-14) se ve que existe precisamente una función determinante sobre 
matrices n x n sobre K. Si se representa esta función por det, viene dada por 


(5-15) det (4) = 3 (sgn 0)A(1, dl) e. A (n, on) 


donde la suma se extiende sobre las distintas permutaciones a de grado n. Todo 
esto se puede resumir formalmente como sigue. 


Teorema 2 Sea K un anillo conmutativo con unidad y sea n un entero po- 
sitivo. Existe exactamente una función determinante sobre el' conjunto de las 
matrices n x n sobre K, y es la función det definida por (5-15). Si D es cualquier 
función alternada n-lineal sobre K"*", entonces para toda matriz n x hn, Á, 


D(A) = (det A)JD(). 


Este es el teorema que habíamos buscado, pero se ha dejado un vacio en 
la demostración. Este vacío es la demostración de que —para una permutación 
dada ga, cuando se pasa de (1, 2, ..., n) a (ol, 02, ..., an) por intercambio 
de pares— el número de intercambios es siempre par o impar. Este hecho com- 
binatorio básico puede ser demostrado sin referencia alguna a los determinantes. 
Pero quisiéramos indicar cómo se desprende de la existencia de una función 
determinante sobre las matrices n x n. 

Sea K el anillo de los enteros. Sea D una función determinante sobre las 
matrices hn x n sobre K. Sea gd una permutación de grado n y supóngase que 
se pasa de (1, 2,...,n)a (al, 02, ..., an) por m intercambios de los pares (i, j), 
i E j. Como se vio en (5-13) 


(—1)” = Dléo, . . - , Eon) 
esto es, el número (—1)” debe ser el valor de D sobre la matriz de filas 


Estr ---> Esp» DÍ 
Díta,---> €sn) = 1, 
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entonces m debe ser par. Si 
Dlea, e... 7 €sn) = —1, 


entonces m debe ser impar. 

Como tenemos una fórmula explícita para el determinante de una matriz 
n x n y en esta fórmula intervienen las permutaciones de grado n, concluimos 
esta sección haciendo algunas observaciones más respecto a las permutaciones, 
Primero obsérvese que hay exactamente n! =1-2--*-m permutaciones de 
grado n. En efecto, si d es tal permutación, existen n elecciones posibles para al; 
cuando esta elección se ha hecho, existen (n — 1) elecciones posibles para 
02; luego (n — 2) elecciones para a3, y así sucesivamente. En consecucncia, 
se tienen 


nín — D(n-— 2) -::2-1l=nm! 


permutaciones a. La fórmula (5-15) para det (4) da así el det (4) como suma 
de n! términos, uno por cada permutación de grado n. Un término dado es 
un producto 

Á(l, 01) --- A(n, an) 


de n elementos de 4, un elemento de cada fila y un elemento de cada columna 
precedido de signo «+» O «—», según que o sea permutación par o impar. 
Cuando las permutaciones se consideran como biyecciones del conjunto 
f1, 2, ..., nj sobre sí mismo, se puede definir un producto de permutaciones. 
El producto de o y 7 será simplemente la función compuesta az definida por 


(07)(2) = a(r(2)). 


Si e representa la permutación identidad, e€(¿) = i, entonces cada gd tiene una 
inversa a” * tal que 


ca? =wtg = e 


Se pueden resumir estas observaciones diciendo que, respecto de la operación 
de composición, el conjunto de las permutaciones de grado n es un grupo. Este 
grupo se llama grupo simétrico de grado rn. 

Desde el punto de vista de productos de permutaciones, la propiedad bási- 
ca del signo de una permutación es que 


(5-16) sen (07) = (sgn 0) (sgn 7). 


Es decir, 7 es una permutación par si a y t son ambas pares o ambas impares, 
mientras que oí es impar si una de las dos permutaciones es impar y la otra 
es par; se puede ver esto por la definición del signo mediante los sucesivos in- 
tercambios de los pares (i, ¡). Puede ser también instructivo indicar cómo 
sen (07) = (sen a)(sgn 1) se desprende de una propiedad fundamental de los 
determinantes. 

Sea K el anillo de los enteros y sean a y t permutaciones de grado n. Sean 
€, - - -, €, las filas de la matriz identidad n x n sobre K. Sea A la matriz con 
filas €,,, . . ., €, y sea B la matriz con filas €, ¡, .. ., €,n- La ¡-ésima fila de A tiene 
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exactamente un elemento no nulo, a saber, el 1 en la columna 1,. Por lo que es 
liicil ver que €, ,, es la ¿-ésima fila del producto de matrices AB. Ahora 


det (4) = sgn 1, det (B) = sen a, y det (4B) = sgn (01). 


Así se tendrá que sen (at) = (sen 0)Xsgn 7), una vez demostrado el siguiente 
tcorema. 


Teorema 3. Sea K un anillo conmutativo con unidad y sean A y B matri- 
ces n x n sobre K. Entonces 


det (AB) = (det ANdet B). 


Demostración. Sea B una matriz n x n dada sobre K, y para cada matriz 
n x n, A, defínase D(4) = det (AB). Si se designan las-filas de A por X,,.... %,, 
entonces 


D(as, ... -7) tn) = det (aB, ..., anB). 


Aquí a;B representa la matriz 1 x n que es el producto de la matriz 1 x n, a,, y 
la matriz n x mn, B. Como 


(ca; + NB = ca¡B + 4B 


y det es n-lineal; es fácil ver que D es n-lineal. Si a, = a,, entonces a,B = aB, 
y como det es alternada 


Dlo,,...,05) =0. 


Luego D es alternada. Ahora bien, D es una función alternada n-lineal, y por 
el Teorema 2 


D(A) = (det A)D(T). 
Pero D(7) = det (1B) = det B, con lo que 
det (AB) = D(4) = (det 4)(det B). 


Que sen (07) = (sen a)Asegn 7) es solo uno de los muchos corolarios del Teo- 
rema 3. Se considerarán algunos de estos corolarios en la siguiente sección. 


Ejercicios 


l. Si K es un anillo conmutativo con unidad y A es la matriz sobre K dada por 


0 ab 
A =| —a 0 c 
=b —c O 
2. Demostrar que el determinante de la matriz de Vandermonde 


l a a 
1 bb 
lc el 


Demostrar que det A = 0. 


es (b — ac — ac — b). 
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3. Escribir explícitamente las seis permutaciones de grado 3, decir cuáles son impares 
y cuáles son pares y usar esto para dar la fórmula completa (5-15) del determinante de unu 
matriz 3 x 3. 


4. Sean o y 7 las permutaciones de grado 4 definidas por 01 = 2,02 = 3,03 =4,04= |, 
11 =3, 12=1,13=2, 714 = 4. 

(a) ¿Es o impar o par? ¿Es 1 impar o par? 

(b) Hallar ot y o. 
5. Si A es una matriz n x n inversible sobre un cuerpo, demostrar que det 4 + 0. 


6. Sea A una matriz 2 x 2 sobre un cuerpo. Demostrar que det (1 + A) = 1 + det A 
si, y solo si, traza (A) = O. 


7. Una matriz n x n, A, se llama triangular si 4;,= 0, siempre que ¿>jo sí Aj; == () 
siempre que ¿ < j. Demostrar que el determinante de una matriz triangular es el producto 
A Az2 *** Ann de los elementos de su diagonal. 


8. Sea A una matriz 3 x 3 sobre el cuerpo de los números complejos. Formamos la matriz 
xI — A con elementos polinomiales, siendo el elemento i, ¡ de esta matriz el polinomio 
0¡¡X — Aj¡- Si f = det (x/ — A), demostrar que f es un polinomio mónico de grado 3, 
Si se escribe 


$ = (1 — 01Mx — ca)(x — cs) 
con números complejos c,, C, y C3, demostrar que 
C¡ +C,+C3 =traza(A) y  C,C,Cy = det A. 


9. Sea n un entero positivo y F un cuerpo. Si y es una permutación de grado n, demos- 
trar que la función 


T(x,, ... 1/7 In) = (Zar, .../-7 Ton) 
es un operador lineal inversible en F”. 


10. Sean F un cuerpo, n un entero positivo y S el conjunto de las matrices n x n sobre F. 
Sea V el espacio vectorial de todas las funciones de S en F. Sea W el conjunto de las fun- 
ciones alternadas n-lineales sobre S. Demostrar que W es un subespacio de V. ¿Cuál es la 
dimensión de W? 
M1. Sea T un operador lineal sobre F". Defínase 

Dry(01, . . . , An) = det (Tay, . - . , Tan). 


(a) Demostrar que D, es una función alternada n-lineal. 
(b) Si 
c = det (Ter, ...; Te.) 


demostrar que para n vectores Q%;, ..., 0, arbitrarios se tiene 
det (Ta,, ..., Tan) = cdet (a, . . ., An). 


(c) Si (6 es cualquier base ordenada de F” y A es la matriz de T en la base ordenada G, 
demostrar que det A = c. 
(d) ¿Qué nombre apropiado se podría dar a c? 


12. Si o es una permutación de grado n y A una matriz n x n sobre el cuerpo F con vec- 
tores fila a,, ..., a,, sea c(4) la matriz n x n con vectores fila x,,,..., a 


an” 
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la) Demostrar que (AB) = o(4)B y, en particular, que c(4) = o(DA. 

(b) Si T es el operador lineal del Ejercicio 9, demostrar que la matriz de T en la base 
canónica es a(1). 

(c) ¿Es o” *(1) la matriz inversa de 0(1)? 

(d) ¿Es cierto que o(4A) es semejante a A? 


13. Demostrar que la función signo de las permutaciones es única en el siguiente sentido: 
Si f es cualquier función que asigna a cada permutación de grado n un entero y si f(0t) = 
Ho)f(T), entonces f es idénticamente O o f es idénticamente 1 o f es la función signo. 


5.4. Otras propiedades de los determinantes 


En esta sección mencionaremos algunas de las más importantes propie- 
dades de la función determinante sobre las matrices n x nm. Probablemente 
lo primero que deberíamos señalar es lo siguiente. En el estudio de det A, las 
filas de A han jugado un papel privilegiado. Como no existe diferencia funda- 
mental entre filas y columnas, se puede muy bien esperar que det A sea una 
función alternada n-lineal de las columnas de A. Este es el caso, y para demos- 
trarlo es suficiente hacer ver que 


(5-17) det (4% = det (4) 


donde A' representa la transpuesta de A. 
Si O es una permutación de grado h, 


A*(2, ot) = Alar, 2). 
Por la expresión (5-15) se tiene entonces 
det (4% = > (sgn 0A(o1, 1) --- A(on, n). 


Sii=0"?*j, Alcoi, i)= A(j, o *j). Con lo que 
A(o1, 1) --- Al(on, n) = A(1, 0711) --- A(n, 07m). 


1 


Como ca” es la permutación identidad 


(sen 0)(sgno) =1 o  sgn (o?) = sen (0). 


Además, como «a varía sobre todas las permutaciones de grado n, también lo 
hace o7?*. Por tanto, 


det (49 = Y (sgn o“ BDA(, 0711) --- A(n, on) 


= det A 
que demuestra (5-17). 

En ciertas ocasiones se necesita calcular determinantes dados. Cuando ello 
es necesario, suele ser útil aprovechar la siguiente propiedad. Si B se obtiene 
de A por la adición de un múltiplo de una fila de A a otra (o un múltiplo de una 
columna a otra), entonces 


(5-18) det B = det A. 
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Se demostrará la afirmación para las filas. Sca B la que se obtiene de A por la 
adición de ca, a a, donde ¿ < j. Como det es lineal como función de la ¡-ésima 
fila 
det B = det A + cdet (01, .. ., Aj)... Oj,» . . , On) 
= det A. 
Otra propiedad útil es la siguiente. Supóngase que tenemos una matriz 
n x n en forma de bloque 
h B 
0 C 


donde A es una matriz r x r, C una matriz s x s, B una matriz r x s y O re- 
presenta la matriz nula s x r. Entonces 


(5-19) det h o = (det A)(det C). 


Para demostrarlo, se define 


A B 
D(A, B, €) = det | o) 


Si fijamos A y B, entonces D es alternada y s-lineal como función de las filas 
de C. Así, por el Teorema 2 
D(A, B, C) = (det CID(A, B, ID) 
donde / es la matriz identidad s x s. Restando múltiplos de las filas de 7 de 
las filas de B y usando la afirmación (5-18), se tiene 
D(A, B, D) = D(A, 0, DD. 
Ahora, D(A, 0, TI) es evidentemente alternada y r-lineal como función de las 
filas de A. Asi, pues, 
D(A,0, D) = (det A)D(TÍ, O, 1). 
Pero D(I, 0, 1) = 1. con lo que 
D(A, B, C) = (det CID(A, B, I) 
= (det C)D(A, 0, I) 


= (det C)(det 4). 
Por un razonamiento del mismo tipo, o tomando transpuestas 
A 0 
(5-20) des | $ e = (det A)(det C). 


Ejemplo 6. Supóngase que K es el cuerpo de los números racionales y 
que se desea calcular el determinante de la matriz 4 x 4 
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Restando múltiplos adecuados de la fila 1, de las filas 2, 3 y 4, obtenemos la 
matriz 


1 -—1 2 3 
0 4 —4 -—<4 
0 5 —9 —13 


0 3 1 —3 


que según (5-18) tiene la misma matriz que A. Si se resta 3 veces la fila 2 de la 
fila 3 y luego se resta 3 veces la fila 2 de la fila 4. se tiene 


1 —1 2 3 
0 4 —4 —4 
0 0 —4 —8]- 
0 0 4 0 


y nuevamente det B = det A. La forma bloque de B dice que 


det A = det B = 





lo 1-4 —8 
o al , o] = 1082) = 128, 


Sea ahora n > l y sea A una matriz n x n sobre K. En el Teorema l se vio 
cómo construir una función determinante sobre las matrices n x nm, dada una 
de las matrices (n — 1) x (n — 1). Ahora que se ha demostrado la unicidad 
de la función determinante, la fórmula (5-4) dice lo siguiente. Si se fija cual- 
quier columna de índice j, 


det A = Y (—1)*A, det A(1]7). 
¿un 1 


El escalar (—1)** det A(i|j) se suele llamar cofactor i, ¡ de A, o cofactor del 
elemento ¿, ¡de A. La expresión anterior para det A es entonces llamada desarro- 
llo del det 4 por cofactores de la j-ésima columna (o, a veces, desarrollo por 
menores de la ¡-ésima columna). Si se hace 


Ci = (-1)** det A (1) 
entonces la expresión anterior dice que para cada j¡ 


det A = z AsyCij 


donde el cofactor C,, es (—1)'** veces el determinante de la matriz (n — 1) x 
(n — 1) que se obtiene suprimiendo la fila ¿ y la columna f de A. 
S1 ¡ + k, entonces 


E AyCy =0, 
En efecto, remplazando la columna f de A por su columna k y llamando B la 


matriz resultante, entonces B tiene dos columnas iguales y, por tanto, 
det B= 0. Como B(ilj) = A(il/), se tiene 
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O = det B 


= E (DB det B(7) 


z (—1)+A y det A(a|7) 


2 AC ij. 


Istas propiedades de los cofactores pueden resumirse con 


n 


(5-21) AC ij = Ox det A. 
1 


t= 


La matriz n x n, adj A, transpuesta de la matriz de los cofactores de A. 
sc llama adjunta de A. Así 


(5-22) (adj A), = Cy; = (—1)*+ det A(7|7). 
Las expresiones (5-21) pueden resumirse en la ecuación matricial 
(5-23) (adj AJA = (det A)/. 


Queremos ver también que A(adj A) = (det 4). Como 4A'(i|¡) = AGÍ), 
se tiene 


(—D) + det A*(i3) = (—D)i*' det A(y|2) 
que dice simplemente que el cofactor i, ¡de A' es el cofactor j, i de A. Con lo q.1e 
(5-24) adj (4*) = (adj A)' 
Aplicando (5-23) a 4', se tiene 


(adj AYA! = (det A9] = (det A)] 


y transponiendo . 
A(adj] A5)* = (det A)/. 


Usando (5-24) se tiene lo que se deseaba: 


(5-25) A(adj 4) = (det A)/. 


Como para las matrices sobre un cuerpo, una matriz n x n, A, sobre K, 
se dice inversible sobre K si existe una matriz n x n, A7*, con elementos en K, 
tal que A47* = 47*A = ] Si tal matriz existe, es única; en efecto, con el mis- 
mo razonamiento usado en el Capítulo 1, se ve que cuando BA = AC = I 
tenemos que B = C. Las fórmulas (5-23) y (5-25) nos dicen lo siguiente acerca 
de la inversión de matrices sobre K. Si el elemento det A tiene un inverso mul- 
tiplicativo en K, entonces A es inversible y 47* = (det 4)7* adj A es la inversa 
única de A. Reciprocamente, es fácil ver que si A es inversible sobre K, el elemen- 
to det A es inversible en K. Para ello, si BA = ] se tiene 


1 = det / = det (4B) = (det A)(det B). 
Lo demostrado es el siguiente teorema. 
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Teorema 4. Sea A una matriz n x mn sobre K. Entonces A es inversible 
sobre K si, y solo si, det A es inversible en K. Cuando A es inversible, la inversa 
unica de A es 


7% = (det AY * adj A. 


En particular, una matriz n x n sobre un cuerpo es inversible si, y solo si, su de- 
terminante es distinto de cero. 


Debemos señalar que este criterio decisivo para la inversión demuestra 
que una matriz hn x n con una inversa a la izquierda o a la derecha es inver- 
sible. Esta demostración es completamente independiente de la demostración 
que se dio en el Capítulo 1 para las matrices sobre un cuerpo. Queremos tam- 
bién indicar qué quiere decir la inversión para matrices con elementos polino- 
mios. Si K es el anillo de los polinomios F[x], los únicos elementos de K que 
son inversibles son los polinomios escalares no nulos. En efecto, si f y g son 
polinomios y fg = 1, se tiene grd f + grd g = 0, con lo que grd f = grd g = 0; 
es decir, f y g son polinomios escalares. Así, una matriz n x n sobre el anillo 
de los polinomios F[x] es inversible sobre F[x] si, y solo si, su determinante 
es un polinomio escalar no nulo. 


Ejemplo 7. Sea K = R[x] el anillo de los polinomios sobre el cuerpo 
de los números reales. Sea 


a+: 4) B=| q? — 1 +2] 


zx—l 1 22 —2x+3 z 
Entonces, por un cálculo breve, se tiene que det A = x + l y det B= —6. 
Con lo que A no es inversible sobre K. Obsérvese que 
. 1 —x—1 —x — 2 
ada =| aa] adj B = | 242% -3 q? — 1 


y (adj 4)4 = (x + 1), (ad B)B = —61. Es claro que 


a al z a — 2] 
6lL—x2+2%rw-3 1-a 


Ejemplo 8. Sea K el anillo de los enteros y 
1 2 
a=l3 4) 
4 —2 
ad] A = ls | 


Así que A no es inversible como matriz sobre el anillo de los enteros; sin em- 
bargo, se puede también considerar 4 como matriz sobre el anillo de los nú- 
meros racionales. En tal caso A es inversible y 


Entonces det A = —2 y 
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En relación con matrices inversibles queremos mencionar otro hecho ele- 
mental. Las matrices semejantes tienen el mismo determinante; esto es, st /” en 
inversible sobre K yB = P”* AP, entonces det B = det A. Esto es claro, pues 


det (PAP) = (det P-5) (det A)(det P) = det A. 


Esta simple observación permite definir el determinante de un operador line:l 
sobre un espacio vectorial de dimensión finita. Si T es un operador lineal sobre 
V, se define el determinante de T como el determinante de cualquier matriz 
n x n que representa a 7 en una base ordenada de V. Como todas esas matri- 
ces son semejantes, todas tienen el mismo determinante y la definición tiene 
sentido. Referente a esto véase el Ejercicio 11 de la Sección 5.3. 

Se va a estudiar ahora la regla de Cramer para resolver sistemas de ecui- 
ciones lineales. Supóngase que A es una matriz n x n sobre el cuerpo F y que 
se desea resolver el sistema de ecuaciones lineales AX = Y para algún n-tuple 
(Yi, --.> yn). S1 AX = Y, entonces 


(adj AJAX = (adj A)Y 
y asi 
(det A)X = (adj A)Y. 


Con lo que 
(det A)x; 


A (ad] AJias 


3 (—1)*y,; det A (al). 


Esta última expresión es el determinante de la matriz n x n que se obtiene al 
remplazar la columna ¡ de A por Y. Si det 4 = 0, nada de esto tiene sentido; 
sin embargo, si det A X+ O, se tiene la conocida regla de Cramer. Sea A una ma- 
triz n x n sobre el cuerpo F tal que det 4 + 0.Si y,,..., y, son escalares cuales- 
quiera de F, la solución única X = A” *Y del sistema de ecuaciones AX = Y 
viene dada por 


det B j . 
= detA? 3=1,...,n 
donde B, es la matriz n x n que se obtiene de A remplazando la columna ¡ de 
A por Y. 

Al concluir este capítulo deseamos hacer algunos comentarios que sirvan 
para ubicar los determinantes en lo que se cree que es la perspectiva adecuada. 
1De vez en cuando es necesario calcular determinantes, y esta sección se dedicó par- 
cialmente a métodos que facilitan tal trabajo. Pero el papel principal de los deter- 
minantes en este libro es teórico. No se disputa la belleza de cuestiones como 
la regla de Cramer. Pero la regla de Cramer es un instrumento ineficaz para 
resolver sistemas de ecuaciones lineales, sobre todo porque supone demasia- 
dos cálculos. Por tanto, uno debe concentrarse en lo que dice la regla de Cramer, 





Xj 
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mis bien que en cómo calcular con ella. Ciertamente, cuando refiexlonamos 
sobre este capítulo, esperamos que el lector insista más en entender qué es la 
unción determinante y cómo se comporta que en cómo se calculan determi- 
mantes de matrices dadas. 


Ejercicios 


I. Usar la expresión de la adjunta para calcular la inversa de cada una de las siguientes 


nwutrices 3 x 3. 
=2 3 2 cosó O —sen0 
6 0 3 | 0 1 0 
4 1 —1 sn0 0 cos 0 


2. Usar la regla de Cramer para resolver los siguientes sistemas de ecuaciones lineales 
sobre el cuerpo de los racionales. 


(a) + y+ 2= 11 


21-6y-= 2= 0 
3x + 4y + 22 = 0. 
(b) 3z- 2y = 7 
3y—=22= 6 
3z — 2x1 = —1 
3. Una matriz n x n, A, sobre un cuerpo F es antisimétrica si 4* = — A. Si Á €s una ma- 


triz n x n antisimétrica con elementos complejos y n es impar, demostrar que det 4 = 0. 


4. Una matriz n x n, A, sobre el cuerpo F se dice ortogonal si 4A4' = [. Si A €S ortogonal, 
demostrar que det A= +1 Dar un ejemplo de una matriz ortogonal para la cual 
det A = —1. 


5. Una matriz n x n, A, sobre el cuerpo de los números complejos se dice unitaria si 
AA* = I[ (A* denota la transpuesta conjugada de A). Si A es unitaria, demostrar que 
[det 4| = 1. 


6. Sean T y U dos operadores lineales sobre el espacio vectorial Y de dimensión finita. 
Demostrar que 
(a) det (TU) = (det T)Ndet U). 
(b) T es inversible si, y solo si, det TH 0. 
7. Sea A una matriz n x n sobre K un anillo conmutativo con unidad. Supóngase que 
A tiene la forma bloque: 
A 0 ---+ 0 


a= 0 £ "02 


0.0 --- 4; 
donde las A; son matrices r, x r;. Demostrar que 
det A = (det A,)(det 42) - -- (det A). 


8. Sea V el espacio vectorial de las matrices n x n sobre el cuerpo F. Sea B un elemento 
fijo de V y sea T el operador lineal sobre V definido por T¿(4) = AB — BA. Demostrar 
que det 7, = 0. 
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9. Sea A una matriz n x n sobre un cuerpo, Á +0. Si r es un entero positivo cualquiera 
entre 1 y n, una Submatriz r x r de A es cualquier matriz r x r que se obtiene suprimiendo 
(1 — r) filas y (1 — r) columnas de A. El rango de A es el mayor entero positivo r tal que 
alguna submatriz r x r de Á tiene determinante no nulo. Demostrar que el rango de A es 
igual al rango de fila de A (= rango columna de A). 


10. Sea A una matriz n x n sobre el cuerpo F. Demostrar que existen a lo más n escala- 
res e distintos en F tal que det (cT — A) = 0. 


11. Sean A y B matrices n x n sobre el cuerpo F. Demostrar que si Á es inversible existen 
a lo más n escalares c en F para los cuales cA + B no es inversible. 


1. - Si V es el espacio vectorial de las matrices n x n sobre F y B es una matriz n x n dada 
sobre F, sean Lg y Rg los operadores lineales sobre V definidos por LÍ(A4) = BA y 
Ra(A) = AB. Demostrar que 


(a) det La = (det B)”; 
(b) det Ra = (det B)”. 


13. Sea V el espacio vectorial de todas las matrices n x n sobre el cuerpo de los núme- 
ros complejos y sea B una matriz n x n dada sobre C. Se define el operador lineal M, en 
V por Mg(4) = BAB*, donde B* = B'. Demostrar que 


det Mp = [det B|». 


Sea ahora H el conjunto de todas las matrices hermíiticas en V; A es hermítica si A = A*. 
Entonces H es un espacio vectorial sobre el cuerpo de los números rerles. Demostrar que 
la función Tp, definida por T (A) = BAB*, es un operador lineal sobre el espacio vectorial 
real H, y luego demostrar que T¿ = |det B|?”. (Sugerencia: Al calcular det T¿, demostrar 
que Y tiene una base que consta de matrices hermiticas y entonces demostrar que det Tz = 
det M).) 

14. Sean A. B, C, D matrices n x n, conmutativas, sobre el cuerpo F. Demostrar que el 
determinante de la matriz 2n x 2n 
6 B 
e D) 


es det (4D — BC). 


5.5. Módulos 


Si K es un anillo conmutativo con unidad, un módulo sobre K es un sistema 
algebraico que se comporta en forma semejante a un espacio vectorial en que 
K hace las veces del cuerpo escalar. Para precisar, se dice que Y es un módulo 
sobre K (o un K-módulo) si 


l. existe una adición (a, PB)=>0u + f en V, respecto de la cual V es gru- 
po conmutativo; 
2. existe una multiplicación (c, 1) — ca de elementos a en V y c en K tal que 


(c1 + Caja = (10 + Coal 
clar + 09) cor + Cay 
(cicaja = ci(caar) 
la = a. 
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Aquí el K-módulo más importante es el de los módulos nr-tuples K”. Los 
módulos de matrices K”*"” son también importantes. Si Y es cualquier módulo, 
se consideran combinaciones lineales, dependencia lineal e independencia lineal, 
tal como se hizo en un espacio vectorial. Hay que guardarse de aplicar a Y cua- 
lesquiera resultados sobre un espacio vectorial que dependan de la división 
por escalares no nulos, operación de cuerpo que puede no ser lícita en el ani- 
llo K. Por ejemplo, si x%,, ..., a, son linealmente dependientes, no se puede 
concluir que algún a, sea combinación lineal de los otros. Esty-hace más difícil 
encontrar bases en módulos. 

Una base para el módulo Y es un subconjunto linealmente independiente 
que genera el módulo. Esta es la misma definición que se dio para espacios 
vectoriales; y la propiedad importante de una base (3 es que cada elemento 
de Y puede expresarse univocamente como combinación lineal de (algún nú- 
mero finito de) elementos de GB. Si se admite en matemática el axioma de elec- 
ción (véase Apéndice), se puede demostrar que todo espacio vectorial tiene 
una base. El lector está bien enterado de que existe una base en todo espacio 
vectorial generado por un número finito de vectores. Pero este no es el caso 
para los módulos. Por ello se necesitan nombres especiales para los módulos 
que tienen base y los que son generados por un número finito de elementos. 


Definición. El K-módulo se dice módulo libre si tiene una base. Si V tiene 
una base finita de n elementos, entonces V se dice un K-módulo libre con n ge- 
neradores. 


Definición. El módulo V es finitamente generado si tiene un subconjunto 
finito que genere V. El rango de un módulo finitamente generado es el menor 
entero k tal que los k elementos generen V. 


Se repite que un módulo puede ser finitamente generado sin tener una base 
finita. Si V es un K-módulo libre con n-generadores, entonces Y es isomorfo 
al módulo K”. Si (fB,, ..., f,j es una base de Y, existe un isomorfismo que 
aplica el vector c,B, + -** + C,f5, sobre el n-tuple (c,, ..., c,) de K”. No es 
evidente, en forma inmediata, que el mismo módulo Y no pueda ser también 
un módulo libre con k generadores, con k + n. Es decir, no es obvio que dos 
bases cualesquiera de V “deban temer el mismo número de elementos. La de- 
mostración de esto es una interesante aplicación de los determinantes. 


Teorema 5. Sea K un anillo conmutativo con unidad. Si V es un K-módulo 
libre con n generadores, entonces el rango de V es n. 


Demostración. Se tiene que demostrar que Y no puede ser generado por 
menos de n de sus elementos. Como V es isomorfo a K”, se debe hacer ver que, 
st im < n, el módulo K” no es generado por los n-tuples x,, ..., %,,. Sea A la 
matriz de filas x%,, ..., A, Supóngase que cada uno de los vectores de la base 
canónica €,, ..., €, sea combinación lineal de los x,, ..., 0,,. Entonces existe 
una matriz P en K"*"” tal que 


PA =I 
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donde / es la matriz identidad n x n. Sea A la matriz 1 x n que se obtiene al 
adjuntar n — m filas de O a la parte inferior de A y sea P cualquier matriz n x n 
que tiene las columnas de P como sus primeras n columnas. Entonces 


PA = 
Por consiguiente, det 4 + 0. Pero como m < n, al menos una fila de 4 tiem 
todos los elementos O. Esta contradicción muestra Que Q,, ..., %,, nO gene- 


ran K”. 


Es interesante anotar que el Teorema $ establece la unicidad de la dimensión 
de un espacio vectorial (de dimensión finita). La demostración, basada en la 
existencia de la función determinante, es bastante diferente de la demostración 
dada en el Capítulo 2. Por el Teorema 5, se sabe que «módulo libre de rango n» 
es lo mismo que el «módulo libre con n generadores». 

Si V es un módulo libre sobre K, el módulo dual V* consta de todas las fun- 
ciones lineales f de V en K. Si V es un módulo libre de rango n, entonces V* es 
también un módulo libre de rango n. La demostración es la misma que para 


espacios vectoriales. Si (f,, ..., f,j es una base ordenada de V, existe una 
base dual (f,, ..., f.; asociada del módulo V*. La función f, asigna a cada 
a de V su ¿-ésima coordenada respecto de [f,, ..., f,! 


a=fío)B + ++ + fn(o)Ba. 


Si f es una función lineal sobre Y, entonces 


5.6. Funciones multilineales 


El propósito de esta sección es colocar el estudio de los determinantes en 
lo que se cree que es la perspectiva adecuada. Se estudiarán las formas multi- 
lineales alternantes sobre módulos. Estas formas son la generalización natural 
de los determinantes según los presentamos. El lector que no haya leido (o no 
desee leer) la breve introducción sobre módulos de la Sección 5.5, puede aún 
estudiar con provecho esta sección, leyendo cada vez «espacio vectorial sobre 
F de dimensión n» en vez de «módulo libre sobre K de rango n'». 

Sea K un anillo conmutativo con unidad y sea Y un módulo sobre K. Si 
r es un entero positivo. una función L de V" = Vx Vx-:-+x Ven KK se 
dice multilineal si L(x,, ..., a,) es lineal como función de cada x,, cuando los 
otros a, se dejan fijos; esto es. si para cada i 


Elo, ...,C0i + Bi ...,0r) =CLl(01, ...,0%,-.., Ar Eb 
Lío, ...,Bi-.- , Ar). 


Una función multilineal en V” se llama también forma r-lineal sobre Y o forma 
multilineal de grado r sobre V. Tales funciones se llaman r-tensores sobre V, 
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La colección de todas las funciones multilincales sobre V” se denotará M'(V). 
Si L y M pertenecen a M'(V), entonces la suma L + M: 


(L+ Mia, .-.,0+) = Lía, ...,0r) + Mía, ..., ar) 
es también multilineal; y, sí c es un elemento de K, el producto cL: 
(Día, ...,0) = CL(0r, .. ., Ar) 


es multilineal. Por tanto, M'(V) es un K-módulo —un submódulo del módulo 
de todas las funciones de V” en K. 

Sir = 1, se tiene M'(V) = V*, ei módulo dual de funciones lineales sobre Y. 
Las funciones lineales pueden ser también usadas para construir ejemplos de 
formas multilineales de órdenes más elevados. Si f,, ...., f, son funciones linea- 
les sobre V, defínase 


L(a,, .. .7) 01,) =- f1(01)f2(012) nt” f.(0,). 
Evidentemente, £ es una forma r-lineal en Y. 


Ejemplo 9. Si Y es un módulo, una forma 2-lineal sobre Y se llama a me- 
nudo forma bilineal sobre V. Sea A una matriz n x n con elementos en K. En- 


tonces 
L(X, Y) = Y'AX 


define una forma bilineal L sobre el módulo K"**, Análogamente, 
M(a, fB) = a.AB' 
define una forma bilineal M sobre K”. 


Ejemplo 10. La función determinante asocia 4 cada matriz n xn, Á, 
un elemento det 4 en K. Si det A es considerado como función de las filas de A: 


det A = Día, ... , An) 
entonces D es una forma n-lineal en K”. 


Ejemplo 11. Es fácil lograr una expresión algebraica de la forma r-lineal 
general sobre el módulo K”. Si a,, ..., a, son vectores de V y A es la matriz 
r x n con filas x,, ..., a,, entonces, para cualquier función L de M'(K”), 


L(oa, ..«- Ay) — 7 y A j6j, Uy... y 0.) 
i=1 


z A Les, Ay...) ar) 
j= 


3 


2, Atl > Ánrer, .... 7) a) 
j=1 j=1 


l 


Y Y Aj Anullej, €x, A, - - - , Ar) 
j=1 k=1 


2, ArjÁmLtes, Ek, AB) - - «y, Qtr). 


j k=1 
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Si se remplazan a,, ..., A, Sucesivamente por sus expresiones como combi- 
naciones lineales de los vectores de la base canónica y si se escribe A(i, ¡) por 
A¡¡, se obtiene: 


(5-26) L(o, e...) 0tr) = y , A(1, J1) ... Alr, Ir) Le, ... €j,). 


A 


En (5-26) hay un término por cada n-tuple J = (j,, ..., j,) de enteros positi- 
vos entre 1 y n. Hay n” de tales r-tuples. Así, pues, L está completamente deter- 
minada por (5-26) y los valores particulares 


Cy = Lte;, ...) €j,) 


asignados a los 1” elementos (€;,, .. ., €, ). Es también fácil ver que si para cada 
r-tuple J se elige un elemento c; de K, entonces 


(5-27) L(as, ...) Qt) = 2 A(1 31) ... Alr, je)CJ 
define una forma r-lineal sobre K”. 


Supóngase que L es una función multilineal sobre V” y M es una función 
multilineal sobre V*. Se define una función L (Y M sobre V”** por 


(5-28) (LO Mío, . - -, Ars) = Llosr, . . . , Ar) MÍ(Ary1, - . - , Arya). 
Si se piensa de V”** como V” x V?, entonces para a en V” y f en V* 


(LY Ma, B) = Lla)M(6). 


Es claro que L Y M es multilineal sobre V”**. La función L GQ M se llama 
producto tensorial de L y M. El. producto tensorial no es conmutativo. En efec- 
too MBOLÍFTLO MM, a menos que L =0 0 M = 0; sin embargo, el produc- 
to tensorial se relaciona perfectamente con las operaciones modulares en 
M" y M”. 


Lema. Sean L, L, formas r-lineales sobre V; sean M, M, formas s-lineales 
sobre V, y sea c un elemento de K. 


(a) (L+L)89M=cC(LQM)+L,QM; 
(b) LO (cM + M,)= (LTL Q M)+ LO M,.. 


Demostración. Se deja como ejercicio. 


El producto tensorial es asociativo, es decir, si L, M y N son (respectivamen- 
te) formas r-, s- y t-lineales sobre V, entonces 


LOM ON =LQ (1 0 N). 


Ello es inmediato por ser la multiplicación en K asociativa. Por tanto, si £,, 
L,, .- ., E, son funciones multilineales sobre V”*, ..., V”*, entonces el producto 
tensorial 


L=L0O0:::OL; 
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está definido, en forma inequívoca, como función multilineal sobre Y”, donde 


r= Fr, +“: + r;. Se mencionó ya un caso particular al respecto. Si f,,..., f, 
son funciones lineales sobre Y, entonces el producto tensorial 
L=f10---Df 


viene dado por 


L(o,...,0r) = filos) - - > frlas). 


Teorema 6. Sea K un anillo conmutativo con unidad. Si V es un K-módulo 
libre de rango n, entonces M'(V) es un K-módulo libre de rango n; en efecto, 
si Af, ..., f,y es una base para el módulo dual V*, los n" productos tensoriales 


F£,0:::0%f%,  1<j S<Mm...,1<j¡<n 
forman una base de M'(V). 


Demostración. Sea ff,. ..., f,) una base ordenada de V* que es dual 
de la base [f,, ..., f,) de V. Para todo vector a de Y se tiene 


a = fila)B1 + +++ + Ínla)Bn. 


Se hacen ahora los cálculos realizados en el Ejemplo 11. Si £ es una r-forma 
lineal sobre Y y a,, ..., a, son elementos de V, entonces por (5-26) 


L(oa, 2... 0) = . 2 j fi (01) ..”. $, (0) L(Bi,, e... Bi,). 


de» 


En otras palabras, 


(5-29) L = . 2 ; L(Bi, . . . 7 Birds 00 ne? 0 S;.- 


3 


Esto muestra que los »” productos tensoriales 
(5-30) Es =f1 0 -*: Of; 


dados por los r-tuples J = (j,, ..., j,) generan el módulo M'(V). Se ve que 
las diversas r-formas E, son independientes como sigue. Supóngase que para 
cada J tenemos un elemento c, en K y formamos la función multilineal 


(5-31) L = z ciEj. 
Obsérvese que si / = (i,, ..., ¿,), entonces 
_J0 Ix=J 
Ejy(Bir . - - , Bi.) — 1, I=J. 


Por tanto, se ve por (5-31) que 
(5-32) c = L(Bu, e... Bi,). 


En particular. si L = 0, entonces c, = O para todo r-tuple 1. | 
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Definición. Sea L una forma r-lineal sobre un K-módulo Y. Se dice que 
L es alternada sí L(a,, ..., 9,)= 0, siempre que a, = 0, con ¡$ j. 


Si £L es una función multilineal alternada sobre V”, entonces 
Lí(0a,...,%,...,%G%y..., 0%) = —L(09,...,Qj..., Oi...) Gr). 


Es decir, si se transponen dos de los vectores (con indices diferentes) del r-tuple 


(0%, . . ., %,), el valor asociado de L cambia de signo. Como toda permutación 
a es un producto de transposiciones, se ve que £L(%,,, ..., %,,)= (sen 0) 
L(a,, ...3 0,). 


Se designa por A'(V) la colección de todas las formas r-lineales sobre Y. 
Es fácil ver que A'(V) es un submódulo de M"(V). 


Ejemplo 12. Al comienzo de este capítulo se vio que sobre el módulo K” 
existe precisamente una forma alternada n-lineal D con la propiedad de que 
D(€,, -.., €,) = 1. También se demostró. en el Teorema 2, que si £ es cual- 
quier forma de A"(K"), entonces 


L = Lfer, e... 7 €n)D. 


O sea que A"(K”) es un K-módulo libre de rango 1. También se desarrolló una 
fórmula explicita (5-15) para D. En términos de la notación que ahora esta- 
mos usando, dicha fórmula se puede escribir 


(5-33) D = Y (seno) fa 0: O fon. 
donde f,,..., f, son las funciones coordenadas canónicas sobre K” y la suma 
se extiende sobre las n! permutaciones diferentes a del conjunto (1, ..., n). 


Si escribimos el determinante de una matriz A como 
det A = 2-(sgn 0) A(o1, 1) --- A(on, n) 

entonces se obtiene una expresión diferente de D: 

(5-34) D(0,..., 0) = Z (sgn 0) fil1) ** - Ín(00n) 


= Y (sen 0) Llar, . . . , sn) 
donde L=f,09 ::: O f,. 


Hay un método general para asociar una forma alternada a una forma mul- 
tilineal. Si L es una forma r-lineal sobre un módulo V y si gd es una permutación 
de (1, ..., rj, se tiene otra función r-lineal L, definiendo 


Loloa, ... 7) 07) = L(0.,, ...) Olor). 


Si L resulta alternada, entonces £, = (sgn o)L. Ahora, para cada L en M'(V) 
se define una función x,L en M'(V) por 


(5-35) ,L = * (sgn 0)L, 
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esto es, 
(5-36) (r,L) (ar, . . . y) Ar) = Y (sgn 0) L(0ar, e... Agr). 

Lema. r, es una transformación lineal de M'(V) en A"(V). Si L está en A"(V), 
entonces T,L = r!L. 


Demostración. Sea t una permutación cualquiera de (1,..., rj. Entonces 


(r,D) (an, ..., rr) = Y (sgn 0) Lloro, . - - , Arar) 
= (sen 7) > (sgn 70) Lí(0701, . . . , Orar). 


Como «d recorre (una vez) todas las permutaciones de (1, ..., rj, también lo 
hace zo. Por tanto, 


(r-.D (an, ..., Arr) = (sgn 7)Mr,LD) (ar, ..., Ar). 


Así, r,L es una forma alternada. 
Si L está en A'(V), entonces L(a,;, ...,. %,,) = (sen 0) Lla,, ..., 0a,) para 
todo da; luego 7,L = r!L. |] 


En (5-33) se demostró que la función determinante D en A"(K”) es 


D = rl fi 0) -:: Mn) 


donde f,, ..., f, son las funciones coordenadas canónicas sobre K”. Hay una 
observación importante que hacer en relación con este último lema. Si K es 
un cuerpo de caracteristica cero, tal que r! es inversible en K, entonces x aplica 
M'"(V) sobre A'(V). En realidad, en ese caso es más natural desde cierto punto 
de vista usar la aplicación 7, = (1/r!)x en vez de r, ya que 7, es una proyección 
de M'(V) sobre A'(V); es decir, una aplicación lineal de M'(V) sobre A'(V) tal 
que z,(L) = L si, y solo si, L está en A'(V). 


Teorema 7. Sea K un anillo conmutativo con unidad y sea V un K-módulo 
libre de rango n. Si r > n, entonces A'(V) = ([0). Si 1 < 1 < n, entonces A'(V) 


es un K-módulo libre de rango (+). 


Demostración. Sea 1fB,, ..., f,) una base ordenada de Y con base dual 
fi... fny. Si L pertenece a M'(V), se tiene 


(5-37) L = z Ubio - BY iD Ds 


donde la suma se extiende sobre todos los r-tuples J = (j,, ..., j,) de ente- 
ros comprendidos entre 1 y n. Si L es alternada, entonces 


Bs, .. «7 Bj.) =0 


siempre que dos de los índices ¡, sean iguales. Si r > n, entonces en cada r-tuple J 
algún entero debe estar repetido. Con lo cual A'(V) = [0] si r > n. 
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Supóngase ahora que Il < r < n. Si L está en A'(V), la suma en (5-37) debc 
extenderse solo sobre los r-tuples J para los que j,, ..., ¡, son distintos, ya que 
todos los otros términos son 0. Cada r-tuple de enteros distintos entre 1 y n 
es una permutación de un r-tuple J = (j,, ..., j,) tal que j, < - < j,. Este 
tipo especial de r-tuple se llamará una combinación r-aria de j1, ..., nj. Hay 


(”) _ n! 
r ri(n — r)! 
de tales combinaciones. 


Supóngase que se fije una combinación r-aria J. Sea L, la suma de todos los 
términos en (5-37) que corresponden a las permutaciones de las combinacio- 
nes J. Si g es una permutación de (1, ..., rj, entonces 


LíBia ..., Bio.) = (sgn 0) L(Biw .. .3 Bi). 


Con lo que 

(5-38) Li = L(Bñ, - - - , B)D3 
donde 

(5-39) Dy = Y (sgn 0) fin O -- Qin 


= TÁfi O: Di;,). 
Se ve de (5-39) que cada D, es alternada y que 


(5-40) L= E LlBi...,Bi)Ds 


combinación J 
para todo L de A'*(V). La aserción es que las (r) formas D, constituyen una 


base de A"(V). Hemos visto que generan A'(V) y es fácil ver que son independien- 


tes. Si I= (i,, ..., Ly J = (ji, ..., J,) son combinaciones, entonces 
1, I=J 
(5-41) DiBio ...7 Bi,) = LO, IxJ 


Supóngase que se tiene para cada combinación un escalar c, y definase 
L = z ciDy. 
De (5-40) y (5-41) se tiene 
cr = L(Bu, + - -., Bi). 
En particular, si L = 0, entonces c, = O para cada combinación /. | 


Corolario. Si V es un K-módulo libre de rango n, entonces N"(V) es un K- 
módulo libre de rango 1. Si T es un operador lineal sobre V, existe un único ele- 
mento c en K tal que 


L(Ta,, ..., Ta.) = CL(%,, ..., 0) 
para cada forma n-lineal alternada de L sobre V. 
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Demostración. Si L está en A"(V), entonces evidentemente 
Lr(o1, ...-) An) = L(Toa,, ...) Ta.) 


define una forma n-lineal alternada £7. Sea M un generador para el rango 1 
módulo A"(V). Todo L en A"(V) es univocamente expresable como L = aM 
para algún a en K. En particular, M, = cM para un cierto c. Para L = aM 
se tiene 

Lr = (aM Y 
aM7 
a(cM) 
c(aM) 
cL. | 


1 


Naturalmente, el elemento c del último corolario es llamado el determinante 
de T. De (5-39), para el caso r = n (cuando hay solo una combinación J = 
(1, .... n)), se ve que el determinante de T' es el determinante de la matriz que 
representa T en cualquier base ordenada (f,, ..., f,). Veamos por qué. La 
matriz representante tiene ¿, j elementos 


Au = f(T8;) 
de modo que 
DITB,, e...) Tfn) = 2 (sen 0) A(l, al) ... Aín, on) 


= det A. 
Por otro lado, 
Di(TBr, . - . , TBn) = (det T) Ds(Bi, - - - , Bn) 
= det T. 

La razón de estas observaciones es que, por medio del Teorema 7 y su corolario, 
se obtiene una definición del determinante de un operador lineal que no supone 
el conocimiento de los determinantes de matrices. Los determinantes de ma- 
trices pueden ser definidos en términos de determinantes de operadores, en vez 
de al contrario. 

Queremos decir algo más con respecto a las formas especiales r-lineales 
alternadas D, que se asociaron a una base (f,, ..., f,j de V* en (5-39). Es im- 
portante entender que D;(a;, .-., 0, ) es el dererminante de cierta matriz r x r. Si 


Aj = fj(as), 1<7<r,1<j<nm, 
esto es, sl 
os = Aubbi + -** + A ynBn, 1<:72<r 


y J es la combinación r-aria (j,, ..., J,), entonces 
(5-42) Dy(a,, <->») Ar) = 2, (sgn 0) A(1, Je) -** A (n, Jen) 
A(1, 31) -** A(1, jr) 
= det : : : 
A(r,j) -*- A(r, jr) 


172 Algebra lmeal 


Así que D,(%,, ..., 9,) cs el determinante de la matriz r x r formada por las 
columnas /,, .... f, de la matriz r x n que tiene (los n-tuples coordenados de) 
> a, como sus filas. Otra notación que se usa a veces para este determi- 
nante es 

. O(A1, . . -, Ar) 
(543) Dilo, ...,04N == 


Bis, .-..) B;,) 


In esta notación la demostración del Teorema 7 muestra que toda forma r-lineal 
alternada L puede expresarse respecto a una base (f,, ..., f,) por la igualdad 


(6-44) L(0,...,4)= Y Olor... , 0) 


J<-* <jr Bi, ... >; B;,) LtBso o? Bi). 


5.7. El anillo de Grassman 


Muchas de las propiedades importantes de los determinantes y de las for- 
mas multilineales alternadas se describen mejor mediante una operación de 
multiplicación sobre formas llamada producto exterior. Si L y M son, respec- 
tivamente, formas r- y s-lineales alternadas sobre el módulo V, se tiene un pro- 
ducto asociado a L y K, el producto tensorial L Y M. Esta no es una forma 
alternada, a menos que L =0 0 M = 0; sin embargo, se tiene una manera 
natural de proyectarlo en A”"**(V). Parecería que 


(5-45) L.M= Trio (L 9) M ) 


fucra la multiplicación «natural» de las formas alternadas. Pero ¿lo es? 

Consideremos un ejemplo concreto. Supóngase que Y es el módulo K” 
y que f,, ..., f, sean las funciones coordenadas canónicas sobre K”. Si ¡4 j, 
entonces 


if; = mf: O $5) 
es la función (determinante) 
Di =f: Of — fi 04; 


dada por (5-39). Supóngase ahora que k es un índice diferente de ¡ y de j. Entonces 


ral: Of; — fi WD fi) O Ji] 
mal; OO fi; 00 fx) — mal f; Df: 00 fu). 


La demostración del lema que sigue a la ecuación (5-36) muestra que para cual- 
quier forma r-lineal L y para cualquier permutación o de (1, ..., r! 


Tr(L,) = sen o rr(L) 


Di: Ji 


Luego, D;;* f;. = 27304 O $; 9 S;,). Por un cálculo semejante f, - Dj, = 2x3, O 
J; S f,). Con lo que 


Li) Sie fic Si fi) 
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todo lo cual parece muy prometedor. Pero hay un inconveniente. A pesar del 
cálculo que se ha hecho, la supuesta multiplicación de (5-45) no es asociativa. 
En efecto. si l es un índice distinto de los í, j, k, entonces se puede calcular que 


Ds; - Du = Amalf; Of; CO fe 00 fi) 
Dif) fi = Er fi DD e DÍ 


Con lo que, en general 
Li) JO) ALO) fal 


y se ve que el primer intento de encontrar una multiplicación ha dado una ope- 
ración no asociativa. 

El lector no debe sorprenderse si encuentra más bien fatigoso hacer una 
verificación directa para ver que las dos ecuaciones no son asociativas. Ello es 
típico de la materia, y también es típico que hay un hecho general que simpli- 
fica considerablemente las operaciones. 

Supóngase que £ es una forma r-lineal y que M es una forma s-lineal sobre 
el módulo V. Entonces 


Trial (TL) (0 (r,M)) = rey (2 (sgn 0) (sgn 7)L, (Y M.) 
= Y (sgn 0)(sgn 7) 1,4. (Lo (0 M,) 
donde o varía sobre el grupo simétrico, S,, de todas las permutaciones de [1,...., 
ry, y í varía sobre S,. Cada par o, 1 define un elemento (a, 7) de S,,, que permu- 


ta los primeros r elementos de (1, ..., r + sj según o, y los últimos s elemen- 
tos según 1. Es claro que 


y que 


sgn (c, 7) = (sgn 0)(sgn 7) 
y que 
(L 00 Men = L, O £,. 


Por tanto, 
Trye[(r,L) (O) (r,¿M)] = E sgn (0, 7) Tryo [(L 0 M) cn]. 
Ahora bien, ya se ha observado que 


sgn (o, 7), + (LO Mun] = Try (LD M). 


Asi, pues, se sigue que 


(5-46) Tiel[(r,L) 60 (r.M)] = rist rr (L O M). 

Esta fórmula simplifica mumerosos cálculos. Por ejemplo, supóngase que se 
tiene una combinación r-aria I= (i,, ..., ¿,) y una combinación s-aria 
J= (ji ..., j,). Para simplificar, supóngase, además, que 


<< << h<- . <j. 
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Entonces se tienen las funciones determinantes asociadas 


D] = r,(Er) 
D, = (Ey) 


donde E; y E, están dados por (5-30). Usando (5-46), se ve inmediatamente que 


Dx - Dj = rrzo[ (Er) 09 va(Es)] 
= rita (Er O En. 


Como E, Y E), = Ej, y, se sigue que 
D; : D, = ris! Druy. 


Esto sugiere que la ausencia de asociatividad en la multiplicación, (5-45) resulta 
del hecho de que D, : D, + Dy, ,,. Después de todo, el producto de D, y D, 
debería ser D,, y. Para remediar esta situación, definiremos un nuevo produc- 
to, el producto exterior de una forma r-lineal alternada L y una forma s-lineal 
alternada M por 


(5-47) L AM = 7” OM). 
Se tiene entonces 
D.AD5= DiuJ 


para las funciones determinantes sobre K”, y, si es que hay Justicia después de 
todo, se ha tenido que lograr la multiplicación apropiada de las formas multi- 
lineales alternadas. Desafortunadamente, (5-47) deja de tener sentido para el 
caso más general en consideración, ya que no es posible dividir por r!s! en el 
anillo K. Si K es un cuerpo de característica cero, entonces (5-47) tiene sentido 
y se puede proceder sin más a demostrar que el producto exterior es asociativo. 


Teorema 8. Sea K un cuerpo de característica cero, y V un espacio vectorial 
sobre K. Entonces el producto exterior es una operación asociativa sobre las for- 
mas multilineales alternadas sobre V. En otras palabras, si L, M y N son formas 
multilineales alternadas sobre V de grados r, s y t, respectivamente, entonces 


LnM)AN=Lna(MAN) 


Demostración. De (5-47) se sigue que cd(L a M) = cL a dM para cuales- 
quiera escalares c y d. Luego 


ristl[ (LD AM) AN] = ris(L A M) AUN 
y como T,(N) — t!N, se tiene que 


Tistl[(L AM)AN]= Ms (LOM) A zm N) 


= En s Tryo+tl[ rio (L D M) 09) .(N)]. 


Por (5-46) se sabe que 
rist[(L A M) A N] = Tryo+t(L (0 M Co N). 
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Por un cálculo análogo 
rist[L A(M AN)]= rd MON) 


y, por tanto, L n M)AN=Ln(M a N). ] 

Volvamos ahora al caso general en el que solo se supone que K es un anillo 
conmutativo con unidad. El primer problema es remplazar (5-47) por una de- 
finición equivalente que opere en general. Si L y M son formas multilineales 
alternadas de grado r y s, respectivamente, se construirá una forma canónica 
multilineal alternada L n M de grado r + s tal que 


ris(L A M) = rra L O) M). 


Recordemos cómo se define rr, , .(L Y M). A cada permutación a de (1, ..., 
r + sj se asocia la función multilineal 


(5-48) (sgn )(L O M. 
donde 


(LO M)aor, . - - , 040) = (LO Mas, - - - , Oo(r+40)) 


y se suman las funciones (5-48) sobre todas las permutaciones y. Hay (r + s)! 
permutaciones; pero como L y M son alternadas, muchas de las funciones 
(S-48) son una misma. En realidad, hay a lo más 


(r + s)! 


r1s! 


funciones (5-48) distintas. Veamos por qué. Sea S,,, el conjunto de las permu- 
taciones de (1, ...,r + sj, es decir, sea S,,, el grupo simétrico de grado r + s. 
Como en la demostración de (5-46), se distingue el subconjunto G que consta 
de las permutaciones g que permutan los conjuntos (1, ...,rjy[r+1,..., 
r + s) sobre sí mismos. En otras palabras, y pertenece a G si 1 < oi < r para 
todo ¡entre 1 y r. (Necesariamente se sigue que r + 1 < di < r + s para todo 
jentre r + 1 y r + s.) Ahora G es un subgrupo de S, ,., esto es, sí o y t están 
en G, entonces o0t7* está en G. Evidentemente, G tiene r!s! elementos. 
Se tiene una aplicación 


Sri) Mr+(V) 
Y(o) = (seno (LQ M).. 


definida por 


Como L y M son alternadas 
vv) = LO M 


para todo y en G. Luego, como (Vo)t = Nzta para cualquier forma (r + s)- 
lineal N sobre V, se tiene 


y(ry) = y(r),  renS,;, yenG. 
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Esto dice que la aplicación y es una constante sobre cada clase lateral (a la 
izquierda) 71G del subgrupo G. Si 1, y 7, están en S, ,,, las clases laterales 1,G y 
T,G son idénticas o disjuntas. Cada clase lateral tiene r!s! elementos; luego, hay 
(r + s)! 
ris! 
clases laterales distintas. Si S,.,,/G representa la colección de todas las clases 
laterales, entonces y define una función en S,,,/G; es decir, por lo que se ha 
visto, hay una función y sobre ese conjunto, de modo que 


Y(r) = Y(rG) 
para todo í de S,,.. Si H es una clase lateral a la izquierda de G, entonces 
Ú(H) = y(t) para todo 1 de H. 
Se define ahora el producto exterior de las formas multilineales alternadas 
L y M de grados r y s haciendo 


(5-49) LAM=zZY0D 


donde H varía sobre S,, ,/G. Otro modo de expresar la definición de L a M es 
la siguiente. Sea S cualquier conjunto de permutaciones de (1, ..., r + sj 
que contenga exactamente un elemento de cada clase lateral a la izquierda de 
G. Entonces 


(5-50) L AM = (sen o)(L OQ M). 
donde o varía sobre S. Claro es que 
Tit AM = mi(LQ M) 


con lo que la nueva definición es equivalente a (5-47) sí K es un cuerpo de ca- 
racterística cero. 


Teorema 9. Sea K un anillo conmutativo con unidad y sea V un módulo 
sobre K. Entonces el producto exterior es una operación asociativa sobre las for- 
mas multilineales alternadas sobre V. En otras palabras, si L, M y N son formas 
multilineales alternadas sobre V de grados r, s y t, respectivamente, entonces 


Lr MaAN=LA(ManN) 
Demostración. Aunque la demostración del Teorema 8 no se aplica aquí, 


sí sugiere cómo tratar el caso general. Sea G(r, s, £) el subgrupo de S,., .+, que 
consta de las permutaciones que permutan los conjuntos 


[1L,... 7) b+1L...,7+9, fr+8+1...,r+8s+0 
sobre sí mismos. Entonces (sgn XL Y M Y N), es la misma función multi- 
lineal para todos los y: de una clase lateral a la izquierda dada de G(r, s, 1). Se 
escoge un elemento de cada clase lateral a la izquierda de G(r, s, t) y sea E la 


suma de los correspondientes términos (sgn NL Y M O N),. Entonces E es 
independiente de cómo se hayan elegido los representantes y, y 


ris11! E = Tre (L 0 M 00 N). 
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Se verá, ahora, que (L A M)ANy LrA(M A N) son iguales a E. 
Sea G(r + s, 1) el subgrupo de S,.,.,, que permuta los conjuntos 


[(1,..., 7 +Hsh)ftr+s+1...,r+8s+1) 


sobre sí mismos. Sea T cualquier conjunto de permutaciones de (1, ...,r + 
s + £) que contenga exactamente un elemento de cada clase lateral de G(r + s, £). 
Por (5-50) 

LAM)AN=YZ (sgor[L A M) ON], 


donde la suma se extiende sobre las permutaciones t de 7. Ahora bien, sea 
G(r, s) el subgrupo de S,,,. que permuta los conjuntos 


4d... 7 (fr+1...,7+8) 


sobre si mismos. Sea S cualquier conjunto de permutaciones de (1, ...,r + sj 
que contenga exactamente un elemento de cada clase lateral a la izquierda de 
G(r, s). De (5-50) y con lo que se ha visto anteriormente, se sigue que 


LAM)AN = 2 (sen o)(sgn 7) [(L Y M). O Nj, 


donde la suma se extiende sobre todos los pares a, 1 de S x T. Si se conviene 
en identificar cada o de S,.,. con el elemento de S,,.,, que coincida con a en 
DL ..., r + sj, y sea la identidad en [r+s +1, ..., r +5 + £)], entonces 
se puede escribir 


LAMAN= Z sgn (on [LO M O Mol. 
Pero 
(LO MO No), = LQ MO No. 
Luego 
LLAMAN = Z sen Tr LOQ MO No... 


Supóngase ahora que se tiene 
T10] = 7202 Y 


con a; en S, 1, en T y y en Gír, s, 1). Entonces 1, * 1, = 1t,y0,* y como 0,y0; * 
está en G(r + s, £), se sigue que 1, y 7, están en la misma clase lateral a la 1z- 
quierda de G(r + s, £). Por tanto, t, = 1, y 06, = 0,7. Pero esto implica que 
0, y 0, (considerados como elementos de S,,.) pertenecen a la misma clase 
lateral de G(r, s); luego 0, = G,. Por tanto, los productos za que correspon- 


den a los 
(rs+0!(r+3)! 
(r Hs! ris! 





pares (7, a) de T x S son todos distintos y están en distintas clases laterales 
de G(r, s, t). Como hay exactamente 


(rEs+0! 
ristt1 
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clases laterales a la izquierda de G(r, s, £)en S, , ¿+,, Se sigue que (L A M) A N=E., 
Por razonamiento análogo, también Ln, (MA N)=E. 


Ejemplo 13. El producto exterior está íntimamente relacionado con cier- 
tas fórmulas para calcular determinantes, conocidas como desarrollos de Laplace. 
Sea K un anillo conmutativo con unidad y n un entero positivo. Supóngase 
que l <r<mn, y sea L la forma r-lineal alternada sobre K” definida por 


Án e... Áyr 
L(or, . . . , ar) = det | 
Án ... Á rr 


Sis=n-=r, y Mes la forma s-lineal alternada 


Alt) ... Ain 
Mor, . . . , 0) = det : : 
Ástr+n ... Á on 


entonces L a M = D, la función determinante sobre K”. Esto es inmediato, 
porque L A M es una forma n-lineal alternada y (como puede verse) 


(L A Ma, - . . , En) = 1. 


Si ahora se describe L a M en forma apropiada, se obtiene un desarrollo de 
Laplace de la función determinante de una matriz n x n sobre K. 

En el grupo de permutaciones S,,, sea G el subgrupo que permuta los con- 
juntos (1, ..., rj y [r + 1,..., nj sobre sí mismos. Cada clase lateral a la iz- 
quierda de G contiene precisamente una permutación gy tal que 01 <o02=<::: 
< or y a(r + 1) <- +: < on. El signo de estas permutaciones está dado por 


sgn o = (—1)01+ > +or+ (rr 1/2), 
El producto exterior L a M está dado por 
(L A Ma, . -., Un) = 2 (sgn o)L(ao,, ....3 tor) M(0o(r+1)) e...) Oy) 


donde la suma se toma sobre una colección de o, una de cada clase lateral de G. 
Por tanto, 


(LA Mila, .- . 1 0n) 


y  €sL(0j,...,0,)M(05, . - - , 04,) 


<>» --<j 
donde 
es = (— 1)5+ «> -Hje+ (r(r—1)/2) 
k; = o(r + 2). 
En otras palabras, 
Asa ... Años Alr+ro 00 Aron 


det A = 2, ly . : 


Jn<-.<jr 


Aj.1 ... As,r 














Atr+r 0 Akon 


Este es un desarrollo de Laplace. Se pueden obtener otros remplazando los 
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conjuntos (1, .... rj y (r + 1, ..., nj por dos conjuntos de índices comple- 
mentarios diferentes. 

Si V es un K-módulo, se pueden reunir las diferentes formas de módulos 
A"(V) y usar el producto exterior para definir un anillo. Por simplificar, se hará 
esto solo para el caso de un K-módulo libre de rango n. Los módulos A'(V) son 
entonces triviales para r > n. Se define 


AV) = AVDA) O > Har(v). 


Esta es una suma directa externa —algo de lo que no se ha tratado previamente. 
Los elementos de A(V) son los (n + 1)tuples (Lo, ..., £,) con L, en A'(V). 
Adición y multiplicación por elementos de K se definen como se hace para los 
(1 + 1)-tuples. Incidentalmente, A*(V) = K. Si se identifica A'(K) con los 
(n + 1)-tuples (0, ...,0,£,0,..., 0) donde L£ está en A"(K). entonces A'(K) 
es un submódulo de A(V) y la descomposición en suma directa 


MV) = AMO --- Dar(v) 


es válida en el sentido corriente. Como A'(V) es un K-módulo de rango (7). 


se ve que A(V) es un K-módulo libre y 


rango A(V) = z, (”) 


= 2”. 


El producto exterior define una multiplicación en A(V): Utilicese el producto 
exterior sobre formas y extiéndasele linealmente a A(V). Este producto es dis- 
tributivo con respecto a la adición de A(V) y da a A(V) estructura de anillo. 
Este anillo es el anillo de Grassman sobre Y*. No es un anillo conmutativo; 
por ejemplo, si L y M están, respectivamente, en A" y A", entonces 


LAM=(-IP"MAL. 


El anillo de Grassman es importante en varias partes de la matemática. 


6. Formas canónicas 
elementales 


6.1. Introducción 


Se-ha dicho antes que nuestro objetivo principal es el estudio de las trans- 
formaciones lineales sobre un espacio vectorial de dimensión finita. Hasta 
ahora se han dado ejemplos específicos de transformaciones lineales y se han 
demostrado algunos teoremas respecto a las transformaciones lineales generales. 
En el caso de dimensión finita se han empleado bases ordenadas para representar 
tales transformaciones por medio de matrices; y esta representación ha ayu- 
dado a la comprensión de cómo operan. Se ha explorado el espacio vectorial 
L(V, W), que consta de las transformaciones lineales de un espacio en otro, 
y el álgebra lineal L(V, V) que consiste en las transformaciones lineales de un 
espacio en sí mismo. 

En los dos capítulos siguientes se estudiarán los operadores lineales. Nues- 
tro programa se propone seleccionar un operador lineal 7 sobre un espacio 
de dimensión finita Y y «separarlo para ver qué es lo que lo hace importante». 
En esta primera etapa es más sencillo para nuestro propósito usar el lenguaje 
matricial. Vale decir. dado un operador lineal 7, encontrar una base ordenada 
de V en la que la matriz de 7 tome una forma especialmente simple. 

He aquí una ilustración de lo que se intenta. Probablemente las matrices 
más sencillas de manejar, fuera de los múltiplos escalares de la matriz unidad, 
son las diagonales 


Ci 0 0 ..- (0 


0 «a. 0 --- 0 
(6-1) D = 0 0 C3 ----0 
0.0.0 c 
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Seca T un operador lineal sobre un espacio V de dimensión n. Si se puede 
encontrar una base ordenada (Bf = [a,, ..., a, ) de V en la que T se pueda ex- 
presar por medio de una matriz diagonal D (6-1), podrá tenerse más información 
respecto a T. Por ejemplo, números simples asociados con 7, tales como el 
rango de T' o el determinante de 7, pueden determinarse fácilmente por la ma- 
triz D. Se pueden expresar explícitamente la imagen y el espacio nulo de 7. 
Como [7 lg = D si, y solo si, 


(6-2) Tax = Cr0x, k=1,...,2n 


la imagen será el subespacio generado por aquellos a, para los que c, + 0, y 
el espacio nulo será generado por los restantes a,. En efecto. parece Justo decir 
que si se conoce una base ($ y una matriz diagonal D para la cual [7 ]|g = D, 
se podrá responder sin dificultad cualquier pregunta que surja con respecto a 7. 

¿Se puede representar todo operador lineal 7 por medio de una matriz 
diagonal con respecto a alguna base ordenada? Si no, ¿para qué operadores 
F' existe una base semejante? ¿Cómo se puede encontrar tal base si existe? Si 
tal base no existe, ¿cuál es el tipo más sencillo de matriz por la cual puede re- 
presentarse 7? Estas son algunas de las preguntas a que se debe responder en 
este (y en el siguiente) capítulo. El tratamiento se hará más complicado a medi- 
da que se vaya viendo cuáles son las dificultades. 


6.2. Valores propios 


Las observaciones de la introducción sugieren un punto de partida para 
el análisis del operador lineal general 7. Se comienza con (6-2), que sugiere 
se estudien los vectores que son transformados por T en múltiplos de sí mismos. 


Definición Sea V un espacio vectorial sobre el cuerpo F y sea T un operador 
lineal sobre V. Un valor propio de T es un escalar c de F tal que existe un vector 
no nulo a con Ta = coa. Si c es un valor propio de T, entonces 


(a) cualquier a tal que Ta = ca se llama un vector propio de T asociado al 
ralor propio c; 


(D) la colección de todos los a. tales que Ta = ca se llama espacio propio 
asociado «u c. 


Los valores propios se llaman también a menudo raíces características, 
eigenvalores, valores característicos o valores espectrales. En este libro se usará 
solo el nombre de «valores propios». 

Si T es cualquier operador y c es cualquier escalar, el conjunto de los vec- 
tores x tales que Ta = ca es un subespacio de V. Es el espacio nulo de la trans- 
tormación lineal (7 — c1). Se llama a c un valor propio de T si este subespacio 
es distinto del subespacio nulo, es decir, si (7 — cf) no es inyectiva. Si el espacio 
soporte 1” es de dimensión finita (7 — cf), no es inyectiva justamente cuando 
su determinante es distinto de O. En resumen: 
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Teorema 1. Sea T un operador lineal sobre un espucio V de dimensión finita 
v sea c un escalar. Las siguientes afirmaciones son equivalentes. 


(1) c es un valor propio de T. 
(11) El operador (T — cl) es singular (no inversible). 
(111) det (T — cl) = 0. 


El criterio del determinante (111) es muy importante, porque dice cómo se 
pueden encontrar los valores propios de 7. Como det (7' — c7) es un polinomio 
de grado n en la variable c, se determinarán los valores propios como las raices 
de tal polinomio. Se explica esto con más detalle. 

Si (3 es cualquier base ordenada de V y A = [T]g, entonces (T — cl) es 
inversible si, y solo si, la matriz (4 — cf) es inversible. En consecuencia, se 
tiene la siguiente definición. 


Definición. Si A es una matriz n x n sobre el cuerpo F, un valor propio 
de A en Fes un escalar c de E tal que la matriz (A — cl) es singular (no inversible). 


Como c es un valor propio de A si, y solo si, det (4 — cl) = 0, o en for- 
ma equivalente, si, y solo si, det (c/ — A) = O, se puede construir la matriz 
(x1 — A) con elementos polinómicos y considerar el polinomio f = det (x/ — A). 
En tal caso los valores propios de A en F'son los escalares c en Ftales que f(c)=0. 
Por esta razón a f se le llama el polinomio característico de A. Es importante 
observar que f es un polinomio mónico de grado n. Lo cual es fácilmente com- 
probable por la fórmula para el determinante de una matriz en términos de 
sus elementos. 


Lema. Las matrices semejantes tienen el mismo polinomio característico. 


Demostración. Si B = P"*AP, entonces 


det (11 — B) = det (1x1 — P-"AP) 
= det (P-(xI — A)P) 
= det P-1 . det (11 — A) - det P 
= det (x1 — A). | 


Este lema permite definir el polinomio característico de un operador T 
como el polinomio característico de cualquier matriz n x n que representa 
a T en alguna base ordenada de V. Al igual que para las matrices, los valores 
propios de T serán las raíces del polinomio característico de 7. En particular, 
esto muestra que 7 no puede tener más de n valores propios distintos. Es im- 
portante señalar que 7' puede carecer de valores propios. 


Ejemplo 1. Sea T el operador lineal sobre R? representado, en la base 
canónica, por la matriz 
O -—1 
a=l, o] 
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El polinomio característico de T' (o de A) es 


x 1 


det (xI] — A) = la =x22+1. 








Como este polinomio tiene dos raíces no reales, T no tiene valores propios. 
Si U es el operador lineal definido sobre C? y representado por A en la base 
ordenada canónica, entonces U sí tiene dos valores propios, ¿ y —i en C. 


Ejemplo 2. Sea A la matriz (real) 3 x 3 


3 1 —1 
2 2 —1|l 
2 2 0 


Entonces el polinomio característico de A es 


r—3 —1 1 
=2 -—2 1 
—2 —=2 z 


= 23 — 51? 4 81 — 4 = (1 — 1)(x — 2)? 








Con lo que los valores propios de A son 1 y 2.. 

Supóngase que T es el operador lineal sobre R? representado por A en la 
base canónica. Hállense los vectores propios de T asociados a los valores pro- 
pios 1 y 2. Ahora 


2 1 —1 
A-I=|2 1 —1| 
2 2 —1 


Es inmediatamente obvio que A — Í tiene rango 2 (y así, pues, T — ] tiene 
nulidad 1). Con lo que el espacio de los vectores propios asociado al valor propio 
| es unidimensional. El vector a, = (1, 0, 2) genera el espacio nulo de T — [. 
Así que Ta = a si, y solo si, a es un múltiplo escalar de x,. Sea ahora 


11 -—1 
A-—2I=|2 0 —1| 
2 2 —2 


Evidentemente, A — 27 también tiene rango 2, así que el espacio de los vectores 
propios asociado al valor propio 2 tiene dimensión 1. Es evidente que Ta == 2a 
s1, y solo si, a es un múltiplo escalar de a, = (1, 1, 2). 


Definición Sea T un operador lineal sobre un espacio vectorial de dimensión 
finita V. Se dice que T es diagonalizable si existe una base de V tal que cada vector 
suyo sea vector propio de T. 
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La razón del nombre es clara; en efecto, sí existe una base ordenada (Y 0 
(0%, . .., %,) de V en la que cada o, es un vector propio de 7, entonces la mutriz 
de T en la base ordenada (B es diagonal. Si Ta, = c,%,, entonces 


a 


C1 0 -.- 0 
0 C2 0 
[Tle =|: : : 
0 0 Cn 
Por cierto no se requiere que los escalares c,, ..., c, sean distintos, incluso 


pueden ser todos iguales (cuando T'es un múltiplo escalar del operador identidad). 

Se podría también definir T como diagonalizable cuando los vectores pro- 
pios de T' generan V. Esto es solo en apariencia distinto a la definición dada, 
ya que se puede formar una base tomándola de cualquier conjunto generador 
de vectores. 

En los Ejemplos 1 y 2 se han elegido a propósito operadores lineales 7 sobre 
R” que no son diagonalizables. En el Ejemplo 1 se tiene un operador lincal 
sobre R? que no es diagonalizable, porque no tiene valores propios. En el Ejem- 
plo 2 el operador lineal 7' tiene valores propios; en efecto, el polinomio carac- 
terístico de T7' se pudo factorizar completamente sobre el cuerpo de los números 
reales: f = (x — lMa — 2). Sin embargo, T no es diagonalizable, pues existe 
solo un espacio unidimensional de vectores propios asociados a cada valor 
propio de 7. Por tanto, no es posible formar una base de R* con vectores pro- 
pios de 7. 

Supóngase que T' es un operador lineal diagonalizable. Sean c,, ..., c, los 
valores propios distintos de T. Entonces existe una base ordenada (3 con res- 
pecto a la cual T está representado por una matriz diagonal; es decir, los ele- 
mentos de la diagonal son los escalares c,, cada uno de los cuales se repite un 
cierto número de veces. S1 c, aparece repetida d, veces, entonces (se puede dis- 
poner así) la matriz tiene la forma de bloque 


a, 0 ... 0 
(6-3) [Ta =| 9 “Rmn 0 
0 0. ep 
donde /; es la matriz unidad d; x d,. De esta matriz se observan dos cosas. 


Primero, el polinomio característico de T es producto de factores lineales (posi- 
blemente repetidos): 


f = (lx — (JA ... (z — CJ, 


Si el cuerpo escalar F es algebraicamente cerrado, v.g., el cuerpo de los números 
complejos, todo polinomio sobre F' puede ser factorizado (véase Sección 4.5); 
sin embargo, si F no es algebraicamente cerrado, se tendrá una propiedad es- 
pecial de 7 cuando se diga que sus polinomios característicos tienen tal facto- 
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rización. Lo segundo que se observa de (6-3) es que d,, el número de veces que 
Cc, se repite como raíz de f, es igual a la dimensión del espacio de los vectores 
propios asociados al valor propio c,. Ello es así porque la nulidad de una matriz 
diagonal es igual al número de ceros que tiene en la diagonal principal, y la 
matriz [7 — c¡F]g tiene d, ceros en su diagonal principal. Esta relación entre 
la dimensión del espacio propio y la multiplicidad de los valores propios, como 
una raíz de f, no parece ser importante al comienzo; sin embargo, provecrá 
de un medio simple para determinar cuándo un operador dado es diagona- 
lizable. 


Lema. Supóngase que To = cu. Si f es cualquier polinomio, entonces 
Da = ficha. 


Demostración. Se deja como ejercicio. 


Lema. Sea T un operador lineal sobre un espacio vectorial de dimensión 


finita. Sean C,, ..., C, los valores propios aistintos de T, y sea W, el espacio de los 
vectores propios usociados con el valor característico C;. Si W = W, +-:::+MW,, 
entonces 


dim W = dim W, +::: + dimW,. 


En efecto, si GB, es una base ordenada de W,, entonces B = (GB,,..., G,) es una 
base ordenada de W. 


Demostración. El espacio W = W, + --:* + W, es el subespacio genera- 
do por todos los vectores propios de 7. Normalmente, cuando se forma la suma 
W de los subespacios W,, se expresa que dim W < dim W, + --* + dim W,, 
por las relaciones lineales que pueden existir entre los vectores de los diferentes 
espacios. Este lema afirma que los espacios propios asociados a los diferentes 
valores propios son independientes uno de otro. 

Supóngase que (para cada ¿) se tenga un vector f, en W, y supóngase que 
PB. ++: + fB, = 0. Se demostrará que f, = O para cada i. Sea f un polinomio. 
Como Tf, = -;P,, el lema anterior dice que 


O =K(D)0 = FD)B1 + --- + FD)Ba 
= fíc)Br + --- + f(c)8B». 


Eligiendo los polinomios f;,...., f, de modo que 
doa=s=Íb ?1=J3 
$:(c;) 0; = f Aj. 

Entonces 


0 = fi(T)O = 2 9,58, 
J 
= Bi. 


Ahora sea (B, una base ordenada de W, y sea (3 la sucesión KB = (B,,...,B,). 
Entonces (KB genera el subespacio W = W, + ++ + W,. También 03 es una 
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sucesión linealmente independiente de vectores, por lo siguiente. Cualquier 
rusación lineal entre los vectores en (KB tendrá la forma f$, +-:**+$8,=0, 
donde f; es alguna combinación lineal de vectores en GB,. De lo anterior se sabe 
que f$; = O para cada i. Como cada (KB, es linealmente independiente, se ve que 
solo se tiene la relación lineal trivial entre los vectores en BB. | 


Teorema 2. Sea T un operador lineal sobre un espacio vectorial V de di- 
mensión finita. Sean C,, ..., C;, los valores propios distintos de T y sean W, el 
espacio nulo de (T — c¡I). Lo siguiente es equivalente. 


(1) 7 es diagonalizable. 
(11) El polinomio característico de T es 


f= (xP: (x-— cy" 
y dim W,=d,, ¿=1,..., k. 
(111) dim W, + +: + dim W, = dim V. 


Demostración. Ya se observó que (i) implica a (11). Si el polinomio carac- 
terístico f' es producto de factores lineales, como en (11), entoncesd, + -* + + d, = 
dim V. En efecto, la suma de los d, es el grado del polinomio característico y 
ese grado es dim V. Por tanto, (11) implica (111). Supóngase que se tenga (iii). 
Por el lema, se debe tener que V = W, + -+-- + W,, es decir, que los vectores 
propios de T generan V. | 


El análogo al Teorema 2 para matrices puede formularse en la siguiente 
forma. Sea A una matriz n x n con elementos en un cuerpo F y sean C,,..., Cs 
los valores propios distintos de A en F. Para cada i, sea VW; el espacio de las ma- 
trices columnas X (con elementos en FF) tales que 


(A —cDX =0, 


y sea (3, una base ordenada de W;. Las bases B,, ..., (GB, se juntan para formar 
la sucesión de columnas de una matriz P: 


P =|[P,, P>,...] = (G,, .. ., Ga). 


La matriz A es semejante sobre F a una matriz diagonal si, y solo si, P es una 
matriz cuadrada. Cuando P es cuadrada, P es inversible y P7*AP es diagonal. 


Ejemplo 3. Sea 7 un operador lineal sobre R? representado en la base 
ordenada canónica por la matriz 


5-6 -6 
A=|-1 4 al 
3-6 -4 


Se indica cómo se puede calcular el polinomio característico usando sucesivas 
operaciones de fila y columna: 
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r—5 0 6 
1 zx—2 —2 
—3 2=x +4 


x—5 6 6 
1 zx—4 —2 
—3 6 +4 


























z— 5 0 6 
=(x- 2%) 1 1 -2 
—3 =-1 +4 
z—5 0 6 
=(x-—2)| 1 l -—2 
—2 0 242 
: T— 5 6 
= (12) —2 +2 





(x — 2 (1? — 3x2 + 2) 
= (2 — 2*Y(x — 1). 


¿Cuáles son las dimensiones de los espacios de los vectores propios asociados 
con los dos valores propios? Se tiene 


4 —6 — 

A —I-= E 3 | 
3 —6 — 
3 —6 — 

Á — 21 = E 2 2 L 
3 —6 — 


Se sabe que A — / es singular y es claro que rango (A — /) > 2. Por tanto, 
rango (A — 1) = 2. Es evidente que rango (4 — 2]/) = 1. 

Sean W, y W, los espacios de los vectores propios asociados con los valores 
propios 1 y 2. Se sabe que dim W, = 1 y que dim W, = 2. Por el Teorema 2, 
T es diagonalizable. Es fácil obtener una base para R? en que T esté represen- 
tado por una matriz diagonal. El espacio nulo de (7 — 1) es generado por el 
vector a, = (3, —1, 3), con lo que fa, es una base para W,. El espacio nulo 
de T — 2/ (es decir, el espacio W,) consta de los vectores (x,, xz, x3) con 
x, = 2x, + 2x3. Así, un ejemplo de una base de W, es 


Oq = (2, 1, 0) 
as = (2, 0, 1). 


Si BH = (0,, 9, 03), entonces [7 ]g es la matriz diagonal 


1050 
D=|0 2 Ol 
0.0 2 


Que 7 sea diagonalizable quiere decir que la matriz original A es semejante 
(sobre R) a la matriz diagonal D. La matriz P, que permite cambiar las coorde- 
nadas de la base (3 a la base canónica, es (claramente) la matriz que tiene las 
transpuestas de a,, 0,, 44 como vectores columnas: 
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P=|- 


Qy pu Q) 
O = »N 
ri ON 


además, AP = PD, con lo que 


PAAP = D. 


Ejercicios 


1. En cada uno de los siguientes casos, sea T el operador lineal sobre R? representado por 
la matriz A en la base ordenada canónica de R? y sea U el operador lineal en C? repre- 
sentado por A en la base ordenada canónica. Encontrar el polinomio característico de 
T y de U, hallar los valores propios de cada operador y para cada uno de tales valores pro- 
pios c hallar una base para el correspondiente espacio de vectores característicos. 


1 0 2 3 1 1 
A=|, oy a=|_; 11 a=|, 1] 
2. Sea V un espacio vectorial de dimensión n sobre F. ¿Cuál es el polinomio caracterís- 


tico del operador identidad sobre V? ¿Cuál es el polinomio característico para el opera- 
dor cero? 


3. Sea A una matriz triangular n x n sobre el cuerpo F. Demostrar que los valores propios 
de A son los elementos de la diagonal de A, es decir, los escalares A;;. 


4. Sea T un operador lineal sobre R? representado en la base ordenada canónica por la 


matriz 
—9 4 4 
—-8 3 4| 
—16 8 7 


Demostrar que 7 es diagonalizable construyendo una base para R?, cada vector de la cual 


es un vector propio de 7. 
6 —3 — 
A=| 4 —1 -—2l 
10 —5 —3 


S. Sea 
¿Es A semejante, sobre el cuerpo R, a una matriz diagonal? ¿Es A semejante, sobre el cuer- 
po C, a una matriz diagonal? 


6. Sea T el operador lineal sobre R* representado en la base ordenada canónica por la 
matriz 


0 
0 
0 


oo, O 
oc oso 
Ao DOS 
SO 


¿En qué condiciones para a. b y c es T diagonalizable? 
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7. Sca 7 un operador lineal sobre el espacio vectorial Y de dimensión n y supóngase que 
T ticne n valores propios distintos. Demostrar que T' es diagonalizable. 


8. Sean A y B matrices n x n sobre el cuerpo F. Demostrar que si (7 — AB) es inversible, 
entonces 7 — BA €es inversible y que 


(1 — BAJ*=1+ Bl — ABJA. 


9. Usar el resultado del Ejercicio 8 para demostrar que si A y B son matrices n x n sobre 
el cuerpo F, entonces AB y BA tienen los mismos valores propios en F. 


10. Supóngase que Á es una matriz 2 x 2 con elementos reales, simétrica (4* = A). Demos- 
trar que A es semejante, sobre R, a una matriz diagonal. 


11. Sea N una matriz compleja 2 x 2 tal que N? = 0. Demostrar que N=00N es se- 
mejante, sobre C, a 
h 01. 
1 0 


12. Usar el resultado del Ejercicio 11 para demostrar lo siguiente: Si A es una matriz 
2 x 2 de elementos complejos, entonces A es semejante, sobre C, a una matriz de uno de 


los dos tipos siguientes: 
0 5 l a 


13. Sea Y el espacio vectorial de las funciones continuas de R en R; es decir, el espacio 
de las funciones continuas de valor real en el eje real. Sea T el operador lineal sobre Y de- 
finido por 


TN = [0 a 
Demostrar que T no tiene valores propios. 
14. Sea A una matriz diagonal n x n de polinomio característico 
(2 — ey)ó- --(2 — ey)ós, 


donde los c,, ..., €, son distintos. Sea V*el espacio de las matrices n x n, B, tales que 
AB = BA. Demostrar que la dimensión de V es dí + --- + df. 


15, Sea V el espacio de las matrices n x n sobre F. Sea A una matriz n x n dada sobre F. 
Sea T el operador lineal «multiplicación a la izquierda por A» en Y. ¿Tienen A y T los mis- 
mos valores propios? 


6.3. Polinomios anuladores 


Cuando se procura analizar un operador lineal 7, una de las cosas más 
útiles de conocer es la clase de los polinomios que anulan a T. Para precisar, 
supóngase que T es un operador lineal sobre V, espacio vectorial sobre el cuer- 
po F. Si p es un polinomio sobre F, entonces p(T') es también un operador lineal 
sobre V. Si q es otro polinomio sobre F, entonces 


(p + YD) = p(T) + qlT) 
(PDT) = p(DalT). 
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Por tanto, la colección de polinomios p que anulan a 7, en el sentido de que 
p(T) = 0, 


es un ideal en el álgebra de los polinomios F| x]. Puede ser el ideal cero; es decir. 
puede ser que T no sea anulado por cualquier polinomio no nulo. Pero ello no 
puede suceder si el espacio V es de dimensión finita. 

Supóngase que T' es un operador lineal sobre el espacio V de dimensión n. 
Considérense las primeras (1? + 1) potencias de T:: 


LT,T7?..., Tr. 


Esta es una sucesión de n? + 1 operadores en L(V, V), el espacio de los ope- 
radores lineales sobre V. El espacio L(V, V) tiene dimensión n?. Por tanto, 
la sucesión de los n? + 1 operadores debe ser linealmente dependiente, es decir, 
se debe tener que 


cl + AT + +++ +CaT" =0 


para los escalares c;, no todos nulos. En consecuencia, el ideal de polinomios 
que anulan a T tiene un polinomio no nulo de grado n? o menor. 

Conforme al Teorema 5 del Capítulo 4 todo ideal de polinomios consta 
de todos los múltiplos de un cierto polinomio mónico fijo, el generador del 
ideal. Así, pues, al operador 7' corresponde un múltiplo mónico p con la si- 
guiente propiedad: Si f es un polinomio sobre F, entonces f(T) = 0 si, y solo si, 
f = pg, donde g es algún polinomio sobre F. 


Definición. Sea T un operador lineal sobre un espacio vectorial V de di- 
mensión finita sobre el cuerpo F. El polinomio minimal de T es el polinomio móni- 
co generador (único) del ideal de polinomios sobre F que anulan a T. 


El nombre de «polinomio minimal» procede de que el generador de. un 
ideal de polinomios está caracterizado por ser el polinomio mónico de grado 
mínimo en el ideal. Lo cual quiere decir que el polinomio minimal p para el 
operador lineal T está univocamente determinado por estas tres propiedades: 


(1) p es un polinomio mónico sobre el cuerpo escalar. 

(2) p(T) = 0. 

(3) Ningún polinomio sobre F' que anule. a T' tiene grado menor que el 
que tiene p. 


Si A es una matriz n x n sobre F, se define el polinomio minimal de A en for- 
ma análoga, como el único generador mónico del idea! de todos los polinomios 
sobre F que anulan a A. Si el operador 7 está representado en cierta base or- 
denada por la matriz A, entonces T y A tienen el mismo polinomio minimal. 
Esto es porque f(T') está representado en la base por la matriz f(4), de modo 
que f(T) =0 si, y solo si, f(4) = 0. 

De la última observación respecto a operadores y matrices se sigue que las 
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matrices semejantes tienen el mismo polinomio minimal. Ese hecho resulta 
también evidente de la definición, ya que 


HPAAP) = PI(A)P 


para todo polinomio f. 

Queremos hacer otra observación respecto a los polinomios minimales de 
las matrices. Supóngase que Á es una matriz n x n con elementos en el cuer- 
po F. Supóngase que FF, es un cuerpo que contiene a F como subcuerpo. (Por 
ejemplo, A puede ser una matriz con elementos racionales, mientras que F, 
es el cuerpo de los números reales. O A puede ser una matriz con elementos 
reales, mientras que F, es el cuerpo de los números complejos.) Se puede con- 
siderar A como matriz n x n sobre F o como matriz n x n sobre F,. A pri- 
mera vista podría creerse que se obtienen dos polinomios minimales distintos 
para A. Por suerte, ese no es el caso; y debemos ver por qué. ¿Cuál es la defini- 
ción del polinomio minimal para A, considerándola como una matriz n x n 
sobre el cuerpo F? Consideramos todos los polinomios mónicos, con coeficien- 
tes en F, que anulan a A y tomamos el de menor grado. Si f es un polinomio 
mónico sobre F: 


k-1 
(6-4) f=*+ 2 aj 
j=0 
entonces f(4) = O dice simplemente que tenemos una relación lineal entre 
potencias de A: 


(6-5) A* + az ¡A! + e... + a Á + aol = (0. 
El grado del polinomio minimal es el menor entero positivo k tal que existe 
una relación lineal de la forma (6-5) entre las potencias de /, A, ..., A*. Más 


aún, por la unicidad del polinomio minimal, existe para aquel k una, y solo una, 
relación de la forma (6-5); es decir, una vez que el minimal k está determinado, 
existen escalares únicos do, .. . , 4, -, €n F para los que es válido (6-5). Son los 
coeficientes del polinomio minimal. 

Ahora (para cada k) se tiene en (6-5) un sistema de n? ecuaciones lineales 
para las «incógnitas» Mo, ..., 4h -1- Como los elementos de A están en F, los 
coeficientes del sistema de ecuaciones (6-5) están en F. Por tanto, si el sistema 
tiene una solución con los ag, ...., ax, en F;, tiene una solución con los ap, ..., 
a, €n F. (Véase el final de la Sección 1.4.) Está claro ahora que los dos poli- 
nomios minimales son los mismos. 

¿Qué es lo que se sabe hasta ahora con respecto al polinomio minimal de 
un operador lineal en un espacio de dimensión nr? Solo que su grado no excede 
de n?. Pero ésta es una estimación poco aproximada, ya que el grado no puede 
exceder a n. Se demostrará en breve que el operador es anulado por su poli- 
nomio característico. Pero antes queremos observar algo más elemental. 


Teorema 3. Sea T un operador lineal sobre un espacio vectorial V de di- 
mensión n lo sea A una matriz n x n). El polinomio característico y el polinomio 
minimal de T (de A) tienen las mismas raices, salvo multiplicidades. 
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Demostración. Sea p el polinomio minimal de 7. Sca e un escalar. Lo que 
se desea demostrar es que p(c) = 0 sí, y solo sí, e es un valor propio de 7" 
Primero supóngase que p(c) = U. Entonces 


p = (x— c)q 
donde q es un polinomio. Como grd q < grd p, la definición del polinonueo 


minimal p dice que g(7) H 0. Se elige un vector f tal que g(T)f F O. Sea a = q 1/1. 
Entonces 


0 = p(T)B 
= (T — cDa(T)J8 
= (T — cDa 


y así ces un valor propio de T. 
Supóngase ahora que c es un valor propio de T, o sea Fa = ca, con a + (). 
Como se observó en el lema anterior, 


p(T)a = p(c)ja. 
Ya que p(T) = 0 y a E O, se tiene que plc) = O. ] 


Sea T' un operador lineal diagonalizable y sean c,, ..., €, ios valores pro- 
pios distintos de 7. Entonces es fácil ver que el polinomio minimal de T es el 
polinomio 


p = (1 — c1) --- (x — cx). 
Si a es un vector propio, entonces uno de los operadores T — cl, ..., 
T — Cjl aplica a en 6. Por tanto, 


(T — al) --- (T — aa = 0 


para todo vector propio a. Existe una base para el espacio soporte que consta 
de los vectores propios de T'; luego 


p(T) = (T — af) --- (T — cif) =0. 


Lo que concluimos es lo siguiente. Si 7 es un operador lineal diagonalizable, 
entonces el polinomio minimal de 7 es un producto de factores lineales dis- 
tintos. Como se verá más adelante, esta propiedad caracteriza los operadores 
diagonalizables. 


Ejemplo 4. Se desea encontrar el polinomio minimal para los operadores 
en los Ejemplos 1, 2 y 3. Se analizarán en orden inverso. El operador del Ejem- 
plo 3 era diagonalizable con polinomio característico 


f=(=- DE -— 22 
Por el párrafo anterior se sabe que el polinomio minimal de T' es 


p = (2 — Mz — 2). 
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ll lector podra verificar directamente que 
(4 — DA -—-2D) = 0. 


in el Ejemplo 2 el operador T también tiene el polinomio característico 
fp: (1 — Dx — 2)”. Pero este T no es diagona lizable, por lo que no se puede 
mber que el polinomio minimal sea (x — lMx — 2). ¿Qué es lo que se sabe 
con respecto al polinomio minimal en este caso? Por el Teorema 3 sabemos 
«que sus raíces son 1 y 2, permitiéndose algunas multiplicidades. Luego, p se 
«debe buscar entre los polinomios de la forma (x — 1(x-— 2 k>1,1> 1. 
Probar (x — 1Mx — 2): 


2 1 —-=1PP11 -—1 
A-DAM-2h)=|2 1 —1fl2 0 -—1 
2 2 —1fl29 2 -2 

2 0 -—1 

=|2 0 —1 

40 -2 


Con lo que el polinomio minimal tiene a lo menos grado 3. Luego se puede 
probar (x — 1)(x — 2) o (x — 1Mx — 2. Cowmo el segundo es el polinomio 
característico, parece ser una elección menos al azar. Se puede en realidad 
calcular que (4 — INA — 21) = 0. Con lo que el polinomio minimal de T es 
su polinomio característico. 

En el Ejemplo 1 se estudió el operador lineal T sobre R? representado en 
la base canónica por la matriz 

O -—1 
a=[) 70) 


El polinomio característico es x? + 1, que no tiene raíces reales. Para deter- 
minar el polinomio minimal hay que olvidarse de T y atender a A. Como una 
matriz compleja 2 x 2, Á tiene los valores propios ¡ y —i. Ambas raíces deben 
figurar en el polinomio minimal. Así el polinomio minimal es divisible por 
x? + 1. Es trivial verificar que 4? + 1 =0. Con lo que el polinomio mini- 
mal es x? + 1. 


Teorema 4 (Cayley-Hamilton). Sea T un operador lineal sobre un espacio 
vectorial V de dimensión finita. Si f es el polinomio característico de FT, entonces 
FT) = 0; es decir, el polinomio minimal divide al polinomio característico de T. 


Demostración. Más adelante se darán dos demostraciones más de este 
teorema, independientemente de la que se dará ahora. La presente demostra- 
ción, aunque breve, puede ser difícil de entender. Aparte de lo breve, tiene la 
virtud de dar una clara y nada trivial aplicación de la teoría general de los de- 
terminantes desarrollada en el Capítulo S. 

Sea K el anillo conmutativo con unidad que consta de todos los polinomios 
en 7. Es claro que K es un álgebra conmutativa con unidad sobre el cuerpo 
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escalar. Elijamos una base ordenada (0,, ..., 0, para Y, y seca A la matriz 
que representa a T en esa base dada. Entonces 


n 
Ta; = 2 Á ¡¡Qj, lÍ<tit<mnm. 
J= 


Estas ecuaciones pueden -escribirse en la forma equivalente 
n 

2 (8:¿T —- AjDa; = O, 1 < 2 < n. 
j=1 


Sea B el elemento de K”*” con elementos 
Bs; = 6:¡T —_ A sil. 
Cuando n = 2 


po [T A — Ani 
L|-Ayl  T-—Agl 


det B =(T — AuDNT — Al) — ArAnl 
= T? — (An + 42)7 + (AnAn — AnAa)l 
= f(T) 
donde f es el polinomio característico: 
f= x?* — (traza A)x + det A. 
Para el caso n > 2, es también claro que 


det B = f(T) 


ya que f es el determinante de la matriz x/ — A cuyos elementos son los po- 
linomios 


(al — Adi = 0;¡T — Asi. 


Queremos demostrar que f(T) = 0. Para que f(T') sea el operador cero es 


necesario y suficiente que (det B)x, = O para k = 1, .... nm. Por la definición 
de B. los vectores x,, ..., A, Satisfacen las ecuaciones 
n 
(6-6) Z B;jaj = O, 1<2<m. 
J= 


Cuando n = 2, se sugiere escribir (6-6) en la forma 
| — Al —Asgl [a] _ Lo] 
—A pl T — AÁsol 03 o 
En este caso. la adjunta, adj B, es la matriz 


B= [774 Ayl 
Ayl T — Ayl 
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fe -— [det B 0 1 


0 det B 


den [2]- em [7] 
- 8(812)) 
- [o] 


En el caso general, sea B = adj B. Entonces por (6-6) 


Luego. se tiene 


n 
2 BuB;¡aj = 0 
j=l 
para todo par k, i, y sumando sobre í, se tiene 


0 = y z BuBija; 


fu] jon 
=3(2 BuBi) a, 
J=1 Vi=1 


Ahora BB = (det B), con lo que 


y BBs; = 0; det B. 
¡=1 
Por tanto, 


0= Y ddet B)a; 
3 . 


= (det Bla, 1<k<wnm. li 


El teorema de Cayley-Hamilton es útil en este momento, fundamentalmente 
porque reduce la búsqueda del polinomio minimal de varios operadores. Si 
se conoce la matriz A que representa T en cierta base ordenada, entonces se 
puede calcular el polinomio característico f. Se sabe que el polinomio minimal 
p divide a f y que los dos polinomios tienen las mismas raíces. No existe mé- 
todo para calcular en forma precisa las raices de un polinomio (a menos que 
su grado sea bajo); sin embargo, si f está factorizado como 


(67) f=(e—c«)%---(x—aJ*,  C,,..., €, diferentes, d, > 1 
entonces 
(6-8) Pp = (x — c,)” .... (x —_ CJ)"; 1 < Pr; < d;. 


Esto es todo lo que se puede decir en general. Si f es el polinomio (6-7) y tiene 
grado n, entonces para cada polinomio p, como en (6-8), se puede encontrar 
una matriz n x n que tiene f como un polinomio característico, y p es su poli- 
nomio minimal. No se demostrará esto ahora. Pero queremos destacar el hecho 
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de que el conocimiento que el polinomio característico tiene la forma (6-7), 
nos dice que el polinomio minimal tiene la forma (6-8), y nada más nos dice 
con respecto a p. 


Ejemplo 5. Sea A la matriz (racional) 4 x 4 


01.01 
_|101 50 
4=l0 1 01l 

1010 

Las potencias de A son fácilmente calculables: 
2020 
020.2 

2 = 
4%=l9 020 
0202 
0404 
404 0 

3= 
4 0404 
404 0 


Así, A? = 44, es decir, si p = x? = 4x = x(x + 2)Mx — 2), entonces p(4) = O. 
El polinomio minimal, obviamente, no es de grado 1, ya que ello querría decir 
que A es un múltiplo escalar de la unidad. Luego los posibles polinomios míni1- 
males son: p, x(x + 2), x(x — 2), x? — 4. Los tres polinomios cuadráticos 
pueden ser eliminados, ya que es inmediatamente obvio que 4? + —24,A? 4 24, 
A? 4 4I. Por tanto, p es el polinomio minimal de A. En particular, 0, 2 y —2 
son los valores propios de A. Uno de los factores x, x — 2, x + 2, debe repe- 
tirse dos veces en el polinomio característico. Evidentemente, rango (4) = 2. 
En consecuencia, existe un espacio de vectores propios de dimensión dos aso- 
ciado al valor característico 0. Por el Teorema 2 queda ahora claro que el poli- 
nomio característico es x?*(x? — 4) y que A es semejante a la matriz sobre el 
cuerpo de los números racionales. 


NOoosS 


oooSo 
ooosSo 
oconNoso 


Ejercicios 


l. Sea Y un espacio vectorial de dimensión finita. ¿Cuál es el polinomio minimal para 
el operador identidad sobre V? ¿Cuál es el polinomio minimal para el operador cero? 


2. Sean «u. b y c elementos de un cuerpo F y sea A la siguiente matriz 3 x 3 sobre F: 


00 c 
A=|1 0 dol 
O l a 
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Demostrar que el polinomio característico de A es x? — ax? — bx — c y que éste es tam- 
hicn el polinomio minimal de A. 


3 Sea A la matriz real 4 x 4: 


11 00 
_|-1 -1- 00 
A=|_2 -2 2 1l 

1 1-10 


Demostrar que el polinomio característico de A es x*(x — 1Y y que es al propio tiempo 
el polinomio minimal. 


4. ¿Es la matriz A del Ejercicio 3 semejante, sobre el cuerpo de los números complejos, 
a una matriz diagonal? - 

5. Sea Y un espacio de dimensión n y sea T un operador lineal sobre Y. Supóngase que 
existe cierto entero positivo k tal que 7* = 0. Demostrar que 7” = 0. 


6. Hallar una matriz 3 x 3 para la cual el polinomio minimal es x?. 


7. Sea n un entero positivo y sea Y el espacio vectorial de los polinomios sobre R que 
tienen a lo más grado n (sin considerar el polinomio 0). Sea D el operador derivación so- 
bre V. ¿Cuál es el polinomio minimal de D? 


8. Sea P el operador en R? que proyecta cada vector sobre el eje x, paralelamente al eje 
ri P(x, y) = (x, 0). Mostrar que P es lineal. ¿Cuál es el polinomio minimal de P? 
9. Sca A una matriz n x n. con polinomio característico 

= —_ d — d 

= (zx C lo.<-(T7 Cc E, 
Demostrar que $= " ( .) 

cid, + cc: + Cid, = traza (A). 
10. Sca V el espacio vectorial de las matrices 4 x n sobre el cuerpo F. Sea A una matriz 
ax on fia. Sca T el operador lineal sobre Y definido por 
T(B) = AB. 

Demostrar que el polinomio minimal de T es el polinomio minimal de A. 
Il. Sean A y B matrices 1 x nm sobre el cuerpo F. De acuerdo con el Ejercicio 9 de la Sec- 


ción 6.1. las matrices 48 y BA tienen los mismos valores propios. ¿Tienen también el mismo 
polinomio característico? ¿Tienen también el mismo polinomio minimal? 


6.4. Subespacios invariantes 


En esta sección introduciremos algunos conceptos útiles en el estudio de 
un operador lineal. Usaremos estas ideas para obtener descripciones de los 
operadores diagonalizables (y triangulables) en términos de sus polinomios 
minimales. 


Definición. Sea V un espacio vectorial y T un operador lineal sobre V. Si 
W es un subespacio de V, se dice que W es invariante por T' si para todo vector a 
de W el vector Ta está en W, es decir, si T(W) está contenido en W. 
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Ejemplo 6. Si 7 es cualquier operador lincal sobre V, entonces V es invu- 
riante por 7, como también lo es el subespacio nulo. La imagen de 7 y el espacio 
nulo de T son también invariantes por 7. 


Ejemplo 7. Sea F un cuerpo y sea D el operador derivación sobre el es- 
pacio F[x] de los polinomios sobre F. Sea n un entero positivo y sea W el sub- 
espacio de los polinomios de grado no mayor que nr. Entonces W es invariante 
por D. Esto no es más que otra manera de decir que D es «decreciente en grado». 


Ejemplo 8. He aquí una útil generalización del Ejemplo 6. Sea T un ope- 
rador lineal sobre V. Sea U cualquier operador lineal sobre Y que conmute 
con T; es decir, TU = UT. Sea W la imagen de U y sea N el espacio nulo de 
U. Ambos W y N son invariantes por 7. Si a está en la imagen de U, por ejem- 
plo, a = Uf, entonces Ta = T(UP) = U(Tf), de modo que Ta está en la imagen 
de U. Si a está en N, entonces U(Ta) = T(Ua) = T(0) = 0; luego Tau está en N. 

Un tipo especial de operador que conmuta con T' es un operador U = g(T), 
donde g es un polinomio. Por ejemplo, podría tenerse U = T — cf, donde ce 
es un valor propio de 7. El espacio nulo de U ya nos es familiar. Se ve que este 
ejemplo incluye el hecho (obvio) de que el espacio de vectores propios de T, 
asociados al valor propio c, es invariante por T. 


Ejemplo 9. Sea T el operador lineal sobre R? representado en la base or- 
denada canónica: por la matriz 


A = h ol 
1 0 
Entonces los únicos subespacios de R? que son invariantes por 7 son R?, y el 
subespacio nulo. Cualquier otro subespacio invariante tendrá necesariamente 
dimensión 1. Pero si W es el subespacio generado por algún vector no nulo a, 
que W es invariante por T' quiere decir que a es un vector propio, pero A no 
tiene valores propios reales. 

Cuando el subespacio W es invariante por el operador 7, entonces T' in- 
duce un operador lineal 7; en el espacio W. El operador lineal Ty, está definido 
por Ty(a) = T(a), para a en W; pero Ty, es un objeto diferente de 7, ya que 
su dominio es W y no V. 

Cuando V es de dimensión finita, la invariancia de W por T tiene una in- 
terpretación matricial simple que acaso deba mencionarse aquí. Supóngase 


que se elige una base ordenada BB = [a,,..., a,) para V tal que BKB'= (x,,..., a,) 
es una base ordenada de W(r = dim W). Sea A = [T]g de modo que 


Ta; = y Á ¡¡Qs. 
it=1 


Como W es invariante por 7, el vector Ta, pertenece a W para ¡ < r. Esto quiere 
decir que , 


(6-9) Taj= D Aya j<r. 
51 
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En otras palabras, A¡¡ =Úsij<rei> r. eos 
Esquemáticamente, A tiene la forma bloque 


(6-10) A = lo p| 


donde B es una matriz r x r, C es una matriz r x (n — r) y D es una matriz 
(n — r) x (n— r). El lector deberá observar que, conforme a (6-9), la matriz 
B es precisamente la matriz del operador inducido 7, en la base ordenada 6”. 

Muy a menudo se razonará respecto a T y Ty, sin hacer uso de la forma 
bloque de la matriz A en (6-10). Pero deberá observarse cómo surgen ciertas 
relaciones entre Ty y T de esa forma bloque. 


Lema. Sea W un subespacio invariante para T. El polinomio característico 
para el operador restricción Ty divide el polinomio característico de T. El poli- 
nomio minimal de Ty divide al polinomio minimal de T. 


_ [BC 
4=L9 p] 
donde A = [Tlg y B = [Ty lg. Por la forma bloque de la matriz 
det (xT — A) = det (21 — B) det (1x1 — D). 


Demostración. Se tiene 


Esto demuestra la afirmación respecto a los polinomios característicos. Obsér- 
vese que se usó indistintamente / para representar matrices unidad en tres ta- 
maños diferentes. 

La k-ésima potencia de la matriz A tiene la forma bloque 


Bt C, 
k = 
A*=l0 px] 


donde C;, es alguna matriz r x (n — r). Por tanto, cualquier polinomio que 
anule a A también anula a B (y también a D). Así, el polinomio minimal de 
B divide al polinomio minimal de 4. | 


Ejemplo 10. Sea T cualquier operador lineal en un espacio Y de dimensión 
finita. Sea W el subespacio generado por todos los vectores propios de T. Sean 
C1, --., Ch los valores propios distintos de 7. Para cada i, sea W, el espacio de 
los vectores característicos asociados con el valor propio c,, y será (3, una base 
ordenada para W,. El lema anterior al Teorema 2 dice que 4" = (GB,,..., GB,) 
es una base ordenada de W. En particular, 


dim W = dim W, + --- + dim W,. 


Sea B' = [a,, ..., a,) de modo que los primeros a forman la base GB,, los 
siguientes, (B,, y así sucesivamente. Entonces 


Ta; = tias, ¿=1,...,7 
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donde lp... LR a o ua a o a Y com e, repetidos 
dim W; veces. 
Ahora W cs invariante por T, ya que para cada a en W se tiene 


a = 01 + --> + 2,0 
Ta = (Ta + +: + l,L,Qr. 
Eligiendo otros vectores 0,+,,, ..., 0, en V tales que BH = fa,, ..., 0,) Scu 


una base para V. La matriz de T, respecto de G3, tiene la forma bloque (6-10), 
y la matriz del operador restricción Ty, respecto de la base 03” es 


L 0 --- 0 
B=|2 + 01 
00 £ 


El polinomio característico de B (es decir, de Ty) es 


g = [(x — c)1 --- (a — c,)a 


donde e, = dim W,. Además g divide a f, el polinomio característico de 7. 
Por tanto, la multiplicidad de c;, como raíz de f, es a lo menos dim W,.. 

Todo esto aclara el Teorema 2; dice solamente que T es diagonalizable si, 
y solo si, r = n, si, y solo si, e, + ::+ + e, = n. Esto no ayuda mucho para 


el caso no diagonalizable, pues no se conocen las matrices C y D de (6-10). 


Definición. Sea W un subespacio invariante para T, y sea a un vector de V. 
El T-conductor de a en W es el conjunto Sa; W), que consta de tados los poli- 
nomios g (sobre el cuerpo escalar) tales que g(Tla está en W. 


Como el operador 7 se considera fijo a lo largo de la mayor parte de los 
análisis, se suprimirá normalmente el subíndice T y se escribirá S(a; W). Los 
autores llaman corrientemente a esta colección de polinomios el «relleno» 
(stuffer, en inglés; o das einstopfende Ideal, en alemán). «Conductor» es el tér- 
mino más corriente, preferido por aquellos que piensan en un operador g(T) 
menos agresivo, que suavemente dirige al vector a en W. En el caso especial 


Je W= 0), el conductor se llama T-anulador de «. 


Lema. Si W es un subespacio invariante para T, entonces W es invariante 
por todo polinomio de T. Asi, pues, para todo a de V, el conductor Sía; W) es 
un ideal en el álgebra de los polinomios F|x|]. 


Demostración. Si fP está en W, entonces 7ff está en W. En consecuencia, 
T(Tf) = T?P está en W. Por inducción, 7*f está en W para cada k. Formando 
combinaciones lineales se ve que f(7)f está en W para todo polinomio f. 

La definición de S(a; W) toma sentido si W es un subconjunto de Y. Si W 
es un subespacio, entonces S(a; W) es un subespacio de F[|x], ya que 


($ + 9 (T) = A(T) + g(T). 
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Si W es también invariante por 7, sea g un polinomio en S(a; W); es decir, 
sea g(T)a en W. Si f es cualquier polinomio entonces f(T)[e(T)a] estará en W. 
Como 


YT) = DIT) 


fe está en S(a: W). Con lo que el conductor absorbe la multiplicación por cual- 
quier polinomio. |] 


El generador mónico único del ideal S(a; W) es también llamado 7-con- 
ductor de a en W (el 7-anulador en caso de que W = (04). El T-conductor de 
a en W es el polinomio mónico g de menor grado tal que g(T)a está en W. Un 
polinomio f está en S(a; W) s1, y solo si, g divide a f. Nótese que el conductor 
S(a; W) siempre contiene el polinomio minimal de 7; luego cada T-conductor 
divide al polinomio minimal de T. 

Como primera ilustración de cómo usar el conductor S(a; W), se caracteri- 
zarán operadores triangulables. El operador lineal T se llama triangulable si 
existe una base ordenada en la cual T está representado por una matriz triangular. 


Lema. Sea V un espacio vectorial de dimensión finita sobre el cuerpo F. 
Sea T un operador lineal sobre V tal que el polinomio minimal de T sea un pro- 
ducto de factores lineales 

p=(x=c)Y e: (x—c)" cenF. 
Sea W un subespacio propio de V (W $ V) invariante por T. Existe un vector 
a tal que 


(a) a no pertenece a W. 
(b) (7 — cia está en W, para algún valor propio c del operador T. 


Demostración. Lo que dice (a) y (b) es que el T-conductor de a en W es 
un polinomio lineal. Sea f cualquier vector en Y que no está en W. Sea g el 
T-conductor de f en W. Entonces g divide a p, el polinomio minimal de 7. Como 
f no está en W, el polinomio g no es constante. Luego 


g= (z _ ca ... (x — Cx)* 
donde al menos uno de los enteros e, es positivo. Se elige ¿ de modo que e; > 0. 
Entonces (x — cC;) divide a g: 
g = (2 — cj)h. 
Por la definición de g, el vector a = k(7)f mo puede estar en W. Pero 
(T — cil)a = (T — e¡D)MT)B 
= g(T)8 


pertenece a W. | 


Teorema 3. Sea V un espacio de dimensión finita sobre el cuerpo F y sea 
T un operador lineal sobre V. Entonces T es triangulable si, y solo si, el polinomio 
minimal de T es producto de polinomios lineales sobre F. 
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Demostración. Supóngase que el polinomio minimal cstá factorizado en 
la forma: 


p= (5 — 1)" --- (1 — ca)”. 


Por aplicación repetida del lema anterior se llega a una base ordenada 


Bf = (a,,..., a, y en la cual la matriz que representa T es triangular superior 
Cu CU 0 Cin 
A  U2 O2n 
(6-11) [Tla =|0 0 az Gan | 
0 0.0 an 
Ahora (6-11) solo dice que 
(6-12) Ta; = aya + +: +4jajy  1<j<m 
esto es, Ta, está en el subespacio generado por %,, ..., a; Para determinar 
los %,, ..., A%,, se comienza aplicando el lema al subespacio W = (0), para 


obtener el vector a,. Entonces aplicando el lema a W,, el espacio generado por 
a, Se obtiene a,. A continuación se aplica el lema a W,, el espacio generado 
por a, y a%,. Se continúa de este modo. Un punto se merece comentario especial. 


Después que se hayan determinado los «,, ..., %,, son las relaciones del tipo 
triangular (6-12) para  = 1...., ¡las que aseguran que el subespacio generado 
por Xy, ..-.. q, es imvariante por 7. 


Si T es triangulable, es evidente que el polinomio característico de 7' tiene 
la forma 


f =— (x _ cJA co. (z — ec), cs €n F. 
Basta observar la matriz triangular (6-11). Los elementos de la diagonal 
A11> - + <> Un SON los valores propios, con c, repetidos d, veces. Pero si f puede 


ser así factorizado, también puede serlo el polinomio minimal, ya que divi- 


deaf A 


Corolario. Sea F un cuerpo algebraicamente cerrado, v.g., el cuerpo de los 
números complejos. Cada matriz n x n sobre F es semejante, sobre F, a una ma- 
triz triangular. 


Teorema 6. Sea V un espacio vectorial de dimensión finita sobre el cuer- 
po F y sea T un operador lineal sobre V. Entonces T es diagonalizable si, y solo si, 
el polinomio minimal de T tiene la forma 


p= (x= C1)*** (x — cz) 
donde los C,, ..., ch son elementos distintos de F. 
Demostración. Se ha observado anteriormente que, si 7' es diagonalizable, 
su polinomio minimal es producto de factores lineales distintos (véase el análi- 


sis anterior al Ejemplo 4). Para demostrar el recíproco, sea W el subespacio 
generado por todos los vectores propios de 7, y supóngase que W 4 V. Por 
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cl lema empleado en la demostración del Teorema 5, existen un vector a que 
no está en W y un valor propio c, de T' tal que el vector 


B = (T — cil)a 
pertenece a W. Como $ está en W 
B=B1+ cc: +6 


donde Tf, = C;Bi, 1 < i< k y, por tanto, el vector 


HKD) = h(cDéBr + :-- + hi(ci)Br 


está en W, para cada polinomio h. 
Ahora, p = (x — cj)q, para algún polinomio q. También 


q — ales) = (x — cy)h. 
Se tiene 
aa — qlejja = MINT — c¡Da = MIA. 


Pero KT)f está en W, y como 
0 = p(T)a = (T — cil)a(T)ja 


el vector q(T Ju está en W. Por tanto, q(c;,)a está en W. Como a no está en W, 
se tiene q(c;) = 0. Lo cual contradice el hecho de que p tiene raíces distintas. 


Al final de la Sección 6.7 se dará una demostración diferente del Teorema 6. 
Además de ser un resultado elegante, el Teorema 6 es útil en cuanto al cálculo. 
Supóngase que se tiene un operador lineal 7 representado por la matriz A en 
cierta hase ordenada, y se desea saber si T es diagonalizable. Se calcula el poli- 
nomio característico f. Si se puede factorizar f: 


f= (2 0J4 --- (1 — ci) 


se tienen.dos métodos diferentes para determinar si 7' es diagonalizable o no. 
Un método es ver si (para todo ¿) se pueden hallar d, vectores propios indepen- 
dientes asociados al valor propio c;. El otro método es comprobar si (7 — c,I) : : : 
(T — cf) es o no el operador cero. 

El Teorema 5 da una demostración diferente para el teorema de Cayley- 
Hamilton. Ese teorema es fácil para una matriz triangular. De donde, por medio 
del Teorema $, se tiene el resultado para cualquier matriz sobre un cuerpo al- 
gebraicamente cerrado. Todo cuerpo es un subcuerpo de un cuerpo algebrai- 
camente cerrado. Si se conoce ese hecho se puede tener una demostración del 
teorema de Cayley-Hamilton para las matrices sobre cualquier cuerpo. Si se 
acepta, por último, el teorema fundamental del álgebra (el cuerpo de los nú- 
meros complejos es algebraicamente cerrado), entonces el Teorema $5 da una 
demostración del teorema de Cayley-Hamilton para las matrices complejas, 
y esa demostración es independiente de la dada anteriormente. 
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Ejercicios 


l. Sea /' el operador lineal sobre R? cuya matriz en la base ordenada canónica es 


A = E 73) 
2 2 
(a) Demostrar que los únicos subespacios de R? invariantes por T son R? y el subus- 
pacio nulo. 
(b) Si U es el operador lineal en C?, cuya matriz en la base ordenada canónica es 4, 
demostrar que U tiene un subespacio unidimensional invariante. 


2. Sea W un subespacio invariante para 7. Demostrar, sin referirse a las matrices, que 
cl polinomio minimal para el operador restricción Ty, divide al polinomio minimal de 7". 


3. Sca c un valor propio de T y sea W el espacio de los vectores propios asociados al valor 
propio c. ¿Cuál es el operador restricción Ty? 


4. Sea 
0 1.0 
A=|2 -—-2 2h 
2 —3 2 


¿Es A semejante, sobre el cuerpo de los números reales, a una matriz triangular? Si es así, 
hallar tal matriz triangular. 


5. Cada matriz A tal que 4? = A es semejante a una matriz diagonal. 


6. Sea T un operador lineal diagonalizable sobre un espacio vectorial Y de dimensión 
n y sea W un subespacio invariante por 7. Demostrar que el operador restricción Ty, es 
diagonalizable. 


7. Sea T un operador lineal sobre un espacio vectorial de dimensión finita sobre el cuerpo 
de los números complejos. Demostrar que 7 es diagonalizable si, y solo si, 7 es anulado 
por algún polinomio sobre C que tiene raíces distintas. 


8. Sea 7 un operador lineal sobre Y. Si todo subespacio de Y es invariante por T, enton- 
ces T es un múltiplo escalar del operador identidad. 


9. Sea T el operador integración indefinida 


In = a 


sobre el espacio de las funciones continuas en el intervalo [0, 1]. ¿Es el espacio de las fun- 
ciones polinomios invariantes por 7? ¿El espacio de las funciones diferenciables? ¿El es- 
pacio de las funciones que se anulan para x = 3? 


10. Sea A una matriz 3 x 3 de elementos reales. Demostrar que si A no es semejante so- 
bre Ra una matriz triangular, entonces A es semejante sobre C a una matriz diagonal. 


11. ¿Es verdadero o falso que si una matriz triangular A es semejante a una matriz dia- 
gonal, entonces A es diagonal? 


12. Sea T un operador lineal sobre un espacio vectorial de dimensión finita sobre un cuer- 
po F algebraicamente cerrado. Sea f un polinomio sobre F. Demostrar que c es un valor 
propio de f(T) sí, y solo si, e = f(t), donde t es un valor propio de 7. 
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13. Sea Y el espacio de las matrices n x n sobre F. Seca A una matriz n x n dada, sobre F. 
Sean T y U los operadores lincales sobre Y definidos por 


T(B) = AB 
U(B) = AB — BA. 
(a) ¿Es verdadero o falso que si A es diagonalizable (sobre F'), entonces T es diagona- 
lizable? 
(hb) ¿Es verdadero o falso que si A es diagonalizable, entonces U es diagonalizable? 


6.5. Triangulación simultánea ; 
Diagonalización simultánea 


Sea V un espacio de dimensión finita y sea $ una familia de operadores 
lineales sobre V. Ocurre preguntar si se pueden triangular o diagonalizar si- 
multáneamente los operadores de $, es decir, cuándo se puede encontrar una 
base (3 tal que todas las matrices [7], con T' en $, sean triangulares (o diago- 
nales). En el caso de la diagonalización, es necesario que $ sea una familia de 
operadores que conmuten: UT = TU, para todo T, U en $. Esto se desprende 
del hecho de que todas las matrices diagonales conmutan. Obviamente es tam- 
bién necesario que cada operador de $ sea un operador diagonalizable. Para 
la triangulación simultánea cada operador en $ debe ser triangulable. No es 
necesario que $ sea una familia de operadores que conmuten; sin embargo, 
esa condición es suficiente para la triangulación simultánea (si cada T es trian- 
gulable individualmente). Estos resultados se desprenden, con ligeras varia- 
ciones, de las demostraciones de los Teoremas 5 y €. 

El subespacio W es invariante por (la familia de los operadores) $ si W es 
invariante por cualquier operador en $ 


Lema. Sea Y una familia de operadores lineales triangulables de V que 
conmutun. Sea W un subespacio propio de V' invariante por Y. Existe un vector 
a en V tal que 


(a) a no pertenece a W; 
(b) para cada T en Y, el vector Ta está en el subespacio generado por a y W. 


Demostración. No se perderá generalidad si se supone que $ contiene solo 
un número finito de operadores, por la siguiente observación. Sea (T,, ..., T,) 
un subconjunto linealmente independiente maximal de $, es decir, una base 
del subespacio generado por $. Si a es un vector tal que (b) es válida para todo 
T,, entonces (b) se cumplirá para todo operador que sea combinación lineal 
de los T,. .... T;. 

Por el lema anterior al Teorema $ (este lema es para un operador solo), 
se puede hallar un vector f, (no en W) y un escalar c, tal que (7, — c,DfB, 
esté en W. Sea V, la colección de todos los vectores fí en V tales que (7, — c, MP 
esté en W. Entonces V, es un subespacio de V que es propiamente más extenso 
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que MW. Además, Y, es invariante por $, por tal razón st F' conmuta con ff, 
entonces 


(T, — AN(TB) = TP, — ae. 


St ff está en V,. entonces (7, — c, Df está en W. Como WV/ es invariante por toda 
T' de $, se tiene que T(T7, — c,Df está en MW”; es decir. Tf en V,, para todo ff 
en V, y todo T en $9. 

Ahora W es un subespacio propio de V,. Sea U, el operador lineal en Y, 
que se obtiene restringiendo 7, al subespacio V,. El polinomio minimal de 
(, divide al polinomio minimal de 7). Por tanto, se puede aplicar el lema an- 
terior al Teorema $5 a tal operador y al subespacio invariante W. Se obtiene 
un vector fi, en V, (no en W) y un escalar c, tal que (7, — c,1)f, está en W. 
Obsérvese que 


(a) f, no está en W. 
(b) (7, — c,Df, está en W. 
(c) (7, — c,Mf, está en W. 


Sea V, el conjunto de todos los vectores f en Y, tal que (7, — c¿Mf está 
en W. Entonces V, es invariante por $. Aplíquese el lema anterior al Teore- 
ma 5 a U,, restricción de 7, a V,. Si se sigue así se llega a obtener un vector 
a = fi, (no en W) tal que (7, — c¡f)a está en W, j¡=1,....r. 

ar 

Teorema 7. Sea V un espacio vectorial de dimensión finita sobre el cuer- 
po F. Sea Y una familia conmutativa de operadores lineales triangulables sobre 
V. Existe una base ordenada de V tal que todo operador de Y está representado 
por una matriz triangular en esa base. 


Demostración. Dado el lema recien demostrado, este teorema tiene la 
misma demostración que la dada para el Teorema 5, si se remplaza T por $. | 


Corolario. Sea Y una familia conmutativa de matrices n x n sobre un cuer- 
po F algebraicamente cerrado. Existe una matriz P, no singular, n x n, con ele- 
mentos en F, tal que P7*AP es triangular superior, para cada matriz A en $. 


Teorema 8, Sea $ una familia conmutativa de operadores lineales diago- 
nalizables en el espacio vectorial V de dimensión finita. Existe una base ordenada 
de V tal que todo operador de Y está representado en esa base por una matriz 
diagonal. 


Demostración. Se puede demostrar este teorema usando el lema anterior 
al Teorema 7 para el caso diagonalizable, de igual mudo como se adaptó el 
lema anterior al Teorema $5 para demostrar el caso diagonalizable para el Teore- 
ma 6..Sin embargo, a esta altura es más fácil proceder por inducción sobre la 
dimensión de V. 

Si dim V = 1, no hay nada que demostrar. Supóngase que el teorema es 
válido para espacios vectoriales de dimensión menor. que n y sea V un espacio 
vectorial de dimensión n. Elíjase cualquier 7 en $ que no sea un múltiplo escalar 
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de la identidad. Sean c,, ..., €, los valores propios distintos de 7, y (para cada ¡) 
sea W, el espacio nulo de (7 — c,f). Se fija un índice ¿. Entonces W, es invariante 
por cada operador que conmuta con 7. Sea $, la familia de operadores lineales 
en W, que se obtiene por la restricción de los operadores de $ al subespacio 
(invariante) W,. Cada operador de $, es diagonalizable, porque su polinomio 
minimal divide al polinomio minimal del correspondiente operador en $. Como 
dim W, < dim V, los operadores en $, pueden diagonalizarse simultáneamente. 
Esto es, MW, tiene una base (3, que consta de vectores que son simultáneamente 
vectores propios para cada operador en $.. 

Como T es diagonalizable, el lema anterior al Teorema 2 dice que GB = 
(B,, ..., GB,) es una base para V. Esa es la base que se buscaba. 


Ejercicios 


1. Hallar una matriz real inversible P tal que P”*4AP y P”*BP sean ambas diagonales, 
donde A y B son las matrices reales 


o E E 


-1 
oo «Ed 3 


2. Sea $ una familia de matrices complejas 3 x 3 que conmutan. ¿Cuántas matrices 
linealmente independientes puede tener $? ¿Qué se puede decir del caso:n x n? 


3. Sea T un operador lineal en un espacio de dimensión n y supóngase que T' tiene n valo- 
res propios distintos. Demostrar que todo operador lineal que conmuta con T es un poli- 
nomio en 7. 


4. Sean A, B, C y D matrices complejas n x n que conmutan. Sea E la matriz 2n x 2n 


A B 
E=[% p) 


Demostrar que det E = (AD — BC). 


S. Sean F un cuerpo, na un entero positivo y V el espacio de las matrices n x n sobre F. 
Si A es una matriz n x n fija sobre F, sea T, el operador lineal sobre V definido por T,¿(B) = 
AB — BA. Considerar la familia de operadores lineales 7, que se obtiene haciendo variar 
A sobre todas las matrices diagonales. Demostrar que los operadores de esa familia son 
simultáneamente diagonalizables. 


6.6. Descomposiciones en suma directa 


Al continuar con el análisis de un operador lineal se deben formular las 
ideas de un modo algo más refinado — menos en términos de matrices y más 
en términos de subespacios. Cuando comenzamos este capítulo, describimos 
su propósito del siguiente modo: encontrar una base ordenada en la cual la 
matriz de 7 toma una forma especialmente simple. Ahora describiremos nues- 
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tro propósito como sigue: descomponer cl espacio base Y en una suma de sub. 
espacios invariantes para 7 tal que los operadores restricción a esos subespicios 
scan simples. 


Definición. Sean W,, ..., W, subespacios de un espacio vectorial V. Se 
dice que W,, ..., W, son independientes sí 
a +0: +o%=0, a, en W, 
implica que cada a, es 0. 


Para k = 2, el sentido de la independencia es la intersección 10]; es docir, 
W, y W, son independientes si, y solo si, W, (7) W, = (0). Si k > 2, la indepen- 
dencia de W,, ..., W, dice mucho más que W, N/- +: (1 W, = (0). Dice que 
cada W; encuentra la suma de los otros subespacios W; solo en el vector nulo. 

El significado de independencia es el siguiente. Sea W, + --: + W, el 
subespacio generado por W,, ..., W,. Cada vector a de W puedé ser expre- 
sado como suma 


Aa = A +: + 9%, a, en W. 


Si W,, ..., W, son independientes, entonces esa expresión de a es única; en 


efecto, si 
a=B, +: + Bs, BP, en W; 


entonces 0 = (a, — fP$¡) +: + (a, — f;,), luego a, — fB| = 0, ¡=1,..., Kk. 
Así, si W,, ..., W, son independientes, se puede operar con los vectores de W 
como k-tuples (a,, ..., %,), con a, en W;, en la misma forma como se opera 
con los vectores de R* como k-tuples de números. 


Lema. Sea V un espacio vectorial de dimensión finita. Sean W,, ..., W, 
subespacios de V y sea W= W, + :*: + W,. Las siguientes afirmacion:s son 
equivalentes. 


(a) W,, .... W, son independientes. 
(b) Para todo j, 2 <j¡< k, se tiene 


WN (w, +occ+ W;_1)= 10%. 


(c) Si KB, es una base ordenada de W,, 1 < i < k, entonces la sucesión 6 = 
(B,, ..., B,) es una base ordenada para W. 


Demostración. Supóngase (a). Sea a un vector de la intersección ¡V, (A 


(W, + +: + W,_,). Entonces existen vectores %;, ..., %j¡_/ COn a, en 4, tales 
que a = a, ++: +0. Como 

a+ +oy1+ (0) +0+-.:+0=0 
y como W,, ..., W, son independientes, debe tenerse que a, = 7, := 


Aj-1 = a =0. 


Ahora obsérvese que (b) implica a (a). Supóngase 


= 01 +: +0, a, en W;. 
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Sea j cl mayor entero í tal que xa, + U. Entonces 


0O=0 +: +0, a; $ 0. 


Así, 4¿= —Q1 —*** —Q¡_/, es un vector no nulo en W¡N(W, +++ +W;_,). 

Ahora que sabemos que (a) y (b) son equivalentes, veamos por qué (a) y (c) 
son equivalentes. Supóngase (a). Sea (B, una base para W,, l < ¡< k, y sea 
B=(GB,, ..., (B,). Cualquier relación lineal entre los vectores de (BB tendrá 
la forma 


Bt --+8=0 


donde f5, es cierta combinación lineal de los vectores en (B,. Como W,, ..., W, 
son independientes, cada f, es 0. Como cada (GB, es independiente, la relación 
que tenemos entre los vectores en (B es la relación trivial. 

Se deja la demostración que (c) implica (a) para los ejercicios (Ejercicio 2). | 


Si cualquiera (y, por tanto, todas) de las condiciones del último lema se 
cumple, se dice que la suma W = W, +: + W, es directa o que W es la 
suma directa de W,, ..., W,, y se escribe 


W=W0---0w. 


En la literatura pertinente el lector puede encontrar esta suma directa como 
suma independiente o suma directa interna de W,, ..., W,. 


Ejemplo 11. Sea V un espacio vectorial de dimensión finita sobre el cuer- 
po F y sea [a,, ..., a,) una base de Y. Si MW, es el subespacio unidimensional 
generado por a,, entonces V = W, O ::: O W,. 


Ejemplo 12. Sea n un entero positivo y F un subcuerpo de los números 
complejos, y sea Y el espacio de todas las matrices n x n sobre F. Sea W, el 
subespacio de todas las matrices simétricas, es decir, matrices A tales que 4' = A. 
Sea W, el subespacio de todas las matrices antisimétricas, es decir, matrices A 


tales que 4* = — A. Entonces V = W, O W,. Si A es cualquier matriz de Y, 
la expresión única para A como suma de matrices, una en W, y la otra en W,, es 
A = Ar + 4A> 
41 = H4 4 4”) 

As = HA — A”). 

Ejemplo 13. Sea 7 cualquier operador lineal sobre un espacio V de di- 
mensión finita. Sean c,, ..., Ch los valores propios distintos de 7, y sea W, el 
espacio de los vectores propios asociados a los valores propios c,. Entonces 
W,,..., W, son independientes. Véase el lema anterior al Teorema 2. En par- 


ticular, si T es diagonalizable, entonces V = W,B ::: BW. 


Definición. Si V es un espacio vectorial, una proyección de V es un operador 
lineal E sobre V tal que E? = E. 
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Supóngase que £ sea una proyección. Sca R la imagen de £ y sea N cl es- 
pacio nulo de E. 


l. El vector f está en la imagen R si, y solo si, Ef = f. Si f| = Ex, en- 
tonces Ef = E?a = En = ff. Recíiprocamente, si f = Ef, entonces (natural- 
mente) f está en la imagen de E. 

2. V=RON. 

3. La expresión única de «a, como suma de vectores en R y en N, es 
o = En + (a — Ex). 


De (1), (Q) y 6) es fácil ver lo siguiente. Si R y N son subespacios de Y tales 
que V= RON, existe un, y solo un, operador proyección E que tiene por 
imagen R y por espacio nulo N. Este operador se llama proyección sobre R según 
o paralelamente a N. 


Cualquier proyección E es (trivialmente) diagonalizable. Si [a,, ..., a,) 
es una base de R y [(%,+1, -.-, 0,) es una base de N, entonces la base 
(B= [g,, ..., %,) diagonaliza a E: 

IT 0 


donde / es la matriz unidad r x r. Esto ayudará a explicar parte de la termino- 
logía relacionada con las proyecciones. El lector deberá ver las diferentes si- 
tuaciones en el plano R? (o el espacio tridimensional, R?), para convencerse 
de que la proyección en R, según N, aplica todo vector en R por proyección 
paralela a N. 

Las proyecciones pueden ser empleadas para describir las descomposicio- 
nes en suma directa del espacio V. En efecto, supóngase que Y = W, D::: MW. 
Para todo j se define un operador E, sobre V. Sea a en V, v.g.,0 = 01 +: +0, 
con a, en W;,. Defínase Eja = a. Entonces E, es una ley bien definida. Es fácil 
ver que E; es lineal, que la imagen de E, es W; y que Ef = Ej. El espacio nulo 
de E, es el subespacio 


WM+-+WatWiat+ cc: +W,) 


en efecto, la afirmación de que E,a = 0 solo dice que a, = 0; es decir, que a es 
efectivamente una suma directa de vectores de los espacios W,, con ¿4 j. En 
términos de las proyecciones E;,, se tiene 


(6-13) a=ÉEja + + + Exa 
para todo a de V. Lo que (6-13) dice es que 
IT =E +++ + E. 
Obsérvese también que si ¿ + j, entonces E,E;, = 0, ya que la imagen de E; es 


el subespacio W,, contenido en el espacio nulo de E, Se resume ahora lo dicho 
y se enuncia y se demuestra un recíproco. 
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Teorema 9. Si V = W, O ::: O W,, entonces existen k operadores linea- 
les E,, ..., E, sobre V tales que 

(1) todo E, es una proyección (E? = E); 

(1) EE¡=0sii4 Jj; 

(m1) [=E, +:::+€;; 

(iv) la imagen de E, es W.. 


Reciprocamente, si E,, ..., E, son los operadores lineales que satisfacen las 
condiciones (i), (1) y (111) y si se hace que W; sea la imagen de E,, entonces V = 
WO: ww. 


Demostración. Solo se necesita probar el recíproco. Supóngase que E,,..., E, 
son operadores lineales sobre Y que satisfacen las tres primeras condiciones 
y sea W;, la imagen de E;. Entonces, claramente 


V=W+--:+W;, 
en efecto, por la condición (111) se tiene 
a= Eat ++: + Exa 
para todo a de Y y Eja está en W,. Esta expresión de a es única, pues si 
a=0a +: +0 


con a, en W,, v.g., a, = E;f;, entonces, por (i) y (11) se tiene 


k 
Eja = Y Eja; 


=1 


k 
z EJEBs 
= Ej8j 

= Es; 

= Qj. 


Esto muestra que V es la suma directa de los W;,. | 


Ejercicios 


Í. Sea Y un espacio vectorial de dimensión finita y sea W, un subespacio de Y. Demos- 
trar que existe un subespacio W, de Y tal que Y = W, O W,. 


2. Sea Y un espacio vectorial de dimensión finita y sean W,, ..., W, subespacios de Y 
tales que 


V=W>.---+0%W y dim V = dim W, + +++ + dim W,. 


Demostrar que YV=W,GBG BW. 
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Y Millar una proyeccion £ que proyecte R* sobre el subespacio generado por (1, 1) 
segun el subespacio generado por (1, 2). 


d. Si FE, y E) son proyecciones sobre subespacios independientes, entonces E, 4 E) es 
una proyección. ¿Es verdadero o falso? 


S. St ¿cs una proyección y f un polinomio, entonces f(E) = al + BE. ¿Qué son a y h 
en terminos de los coeficientes de f? 


6. 51 un operador diagonalizable tiene solo los valores propios O y | es una proyeccion 
¿Es O no cierto? 


7. Demostrar que si £ es la proyección de R según N, entonces (/ — E) es la proyección 
en Y según R. 


8. Scan £,,. ... E, operadores lineales sobre el espacio MU de modo que E, + +: +£, =1. 
(u) Demostrar que si E,E, = 0, para ¡+ j, entonces Ef = E,, para cada i. 
(h) En el caso k = 2, demostrar el recíproco de (a). Esto es, si E, + E, = 1, ademas 
Ii? = E, y El = E,. entonces E,E, =0. 


9. Sean Y un espacio vectorial rcal y £ un operador lineal idempotente en V, es decir, 
una proyección. Demostrar que (/ + E) es inversible. Hallar (1 + E) ?. 


10. Sca F un subcuerpo de los números complejos (o un cuerpo de característica cero). 
Sca Y un espacio vectorial de dimensión finita sobre F. Supóngase que E, ..., E, son pro- 
yecciones de Y y que E, + ::: + E, = [. Demostrar que E,E, = 0, para ¡4 j. (Suge- 
rencia: Usar la función traza y preguntarse qué es la traza de una proyección.) 


ll. Seca J' un espacio vectorial, sean W,. .... M, subespacios de J” y considérese que 
Vi=Wi+ ++ Wat Wat+o+W 

Supóngase que V = U, O ::: 4 W,. Demostrar que el espacio dual 1% tiene la descom- 

posición en suma directa V* = IO -::O Y. 


6.7. Sumas directas invariantes 


Estamos interesados especialmente en descomposiciones en suma directa 
Y =W,O:::Q0W,. donde cada uno de los subespacios W, es invariante 
bajo un operador lineal 7 dado. Dada tal descomposición de Y, T induce un 
operador lineal 7, sobre cada W, por restricción. El efecto de T' es entonces 
el siguiente. Si x es un vector de V, se tienen vectores ÚniCOS %;,, .... A. CON 


a, en W,, de modo que 


a=0 +: +0 


y entonces 
Ta = Tio, + --*: + Tas. 


Esta situación se describirá diciendo que T' es la suma directa de los operadores 
Ti, ..-. Ti Al usar esta terminología, debe recordarse que los 7; no son ope- 
radores lineales sobre el espacio V, pero sí sobre los distintos subespacios W.. 
El hecho de que V = W, O ::: O VW, permite asociar a cada x en Y un k-tuple 
ÚnICO (X%,, -.., %,) de vectores x, en W, (por x = 2%, + :-* + x2,) de modo que 
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podamos efectuar las operaciones lineales en Y trabajando en los subespacios 
individuales W,. El hecho de que cada W, sea invariante por T permite consi- 
derar el efectc de T como efecto independiente de los operadores 7; sobre los 
subespacios W;. Nuestro propósito ahora es estudiar T, encontrando la des- 
composición en suma directa invariante en que los 7; son operadores de una 
naturaleza elemental. 

Antes de ver un ejemplo, observemos el análogo matricial de esta situa- 
ción. Supóngase que seleccionamos una base ordenada 03, para cada W, y sea 
03 la base ordenada de Y constituida por la unión de las (B, dispuestas en el 
orden G,...., B,. de modo que (63 sea una base para V. Del estudio referente 
al análogo matricial para un subespacio invariante simple, es fácil ver que si 
A = [7]8 y A; = [7,]8,, entonces A tiene la forma bloque 


A, O ... ( 
(6-14) apo Hor? 
0 0 -.- Ax 


En (6-14) 4, es una matriz d, x d, (d, = dim W;), y los O son símbolos para los 
bloques rectangulares con escalares O de varias dimensiones. Es también apro- 
piado describir (6-14) diciendo que A es la suma directa de las matrices 
As ...,) Az. 

Más a menudo describiremos el subespacio W; por medio de las proyec- 
ciones asociadas E, (Teorema 9). Por tanto, se necesita expresar la invarianza 
del subespacio W, en térmimos de los E). 

Teorema 10. Sea T un operador lineal sobre el espacio V y sean W.,..., W,y 
E,, ..., E, como en el Teorema 9. Entonces una condición necesaria y suficiente 
para que cada subéspacio W, sea invariante por T es que T conmute con cada una 
de las proyecciones E,: es decir, 

TE, = E¡T, i=l,...., Kk. 


Demostración. Supóngase que T conmute con cada E,. Sea a en W;. Enton- 
ces Eja = a. y 
Ta = T(Eja) 
= E¡(Ta) 
que muestra que Ta está en la imagen de E), es decir, que Wes invariante por T. 
Supóngase ahora que todo W, es invariante por 7. Se ha de demostrar que 
TE; = ET. Sea a cualquier vector de V. Entonces 
a= Ela + +: 4 Exa 
Ta = TE.,a + ... + TEyo. 


Como Ea está en W;, que es invariante por 7, se debe tener que T(E,a) = Ef, 
para cierto vector f,. Entonces 


E,¡TE:a = EE; 


Le si 14%j 
LES; si i= 
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Con lo que 

E,Ta = E,TEia + e... + E ¡TkEisa 
Esb; 
= TE;a. 


Esto vale para cada a de V, o sea E,T = TE. | 


Describiremos ahora un operador diagonalizable T en el lenguaje de las 
descomposiciones en suma directa invariante (proyecciones que conmutan con 
T). Esto será de gran utilidad para entender después unos teoremas de descom- 
posición más profundos. El lector puede pensar que Ja descripción que se ha 
dadc es muy complicada, en comparación con la formulación matricial o la 
simple afirmación de que los vectores propios de T' generan el espacio total. 
Pero se debe tener presente que esta es la primera experiencia con un método 
muy efectivo por medio del cual varios problemas concernientes a subespacios, 
bases, matrices y entes similares pueden reducirse a cálculos algebraicos con 
operadores lineales. Con un poco de experiencia, la eficacia y elegancia de este 
método de razonamiento llegarán a ser claras. 


Teorema 11. Sea T un operador lineal sobre un espacio de dimensión finita 
V. Si T es diagonalizable y si c,, ..., c. son los valores propios distintos de T. 
entonces existen operadores lineales E,, ..., E, en V tales que 


(1) T=c E, +: +CrEx; 
(1) [= E, +:::+ Ex; 
(im) EE, =0. 1% j. 
(iv) E? = E, (£, es una proyección): 
(v) la imagen de E, es el espacio propio de T, asociado a C,. 


Reciprocamente, si existen k escalares distintos Ci, ..., Ch y Kk eperadores 
lineales no nulos E,, ..., E, que satisfucen (1), (1) y (111), entonces T es diagona- 
lizable, C,, ..., cy son los valores propios distintos de T y las condiciones (tv) y (v) 
también se cumplen. 


Demostración. Supóngase que T' es diagonalizable, con valores propios 
distintos C,, ..., Cz. Sea W, el subespacio de los vectores propios asociados 
al valor propio c;. Como se sabe, 


V=W.0---O0v.. 


Sean E,, ..., E, las proyecciones asociadas con esta descomposición, como 
en el Teorema 9. Entonces (11), (111), (iv) y (v) se cumplen. Para verificar (1) se 
procede como sigue. Para cada a en Y, 


a = Ela + ... + Esa 
y así, 
Ta = TEja + --- + TE;,a 
= ciEja + ... + crExa. 


En otras palabras, T=C,E, +: ++<C;¡E,. 
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Ahora supóngase que tenemos un operador lineal 7 junto con escalares 
c, distintos y operadores no nulos E, que satisfacen las condictones (1), (11) y (111). 
Como EE), = 0, cuando i $ j, multiplicando ambos miembros de / = E, ++: 
+ E, por E,, se tiene de inmediato que E? = E,. Muitiplicando T = c,E, + 
++ + CE, por E, se tiene entonces que TE, = c¡E;. lo que muestra que cada 
vector de la imagen de E; está en el espacio nulo de (7 — c,f). Como se ha su- 
puesto que E, + 0, esto demuestra que existe un vector no nulo en el espacio 
nulo de (7 — c,f), es decir, que c, es un valor propio de 7. Además, los c, son 
todos los valores propios de 7”; en efecto, si c es otro escalar cualquiera, entonces 


T =cl = (a — OE, + ++ + (cr — OEs 


con lo que si (7 — cf ja = 0, se debe tener que (c, — c)E¡a = 0. St x no es el 
vector nulo, entonces Ea + 0, para algún i, con lo que para ese ¡ se tiene que 


Ci = a= O. 
Ciertamente T es diagonalizable, ya que se ha visto que todo vector no nulo, 
de la imagen de E;,, es un vector propio de T, y el que I = E, + **- + E, mues- 


tra que estos vectores propios generan V. Todo lo que queda por demostrar 
es que el espacio nulo de (7 — c¿T') es exactamente la imagen de E;. Pero esto 
es evidente, porque si Tu = ca entonces 


k 

z (e; — cyEja = 0 

g= 
luego 

(c; — ci)Eja = 0 para cada ¡ 

y entonces 

Eja = 0, 31. 
Como a = Eja + ::* + Eja y Eja = 0, para j¡ £ í, se tiene que a = Eja, lo 
que demuestra que a está en la imagen de E. | 


Una parte del Teorema 9 dice que para un operador diagonalizable T' los 
escalares C,, ..., €, y los operadores E,, ..., E, están univocamente determi- 
nados por las condiciones (1), (11), (111), por ser los c; distintos y porque los E; son 
no nulos. Una de las ventajas más notables de la descomposición T = c,E, + 
“+ 4 C¡E, es que si g es cualquier polinomio sobre el cuerpo F, entonces 


AT) = g(cyE +: + g(cyEs. 
Dejamos los detalles de la demostración al lector. Para ver cómo se demuestra 


debe calcularse 7” para cada entero positivo r. Por ejemplo, 


k k 
T? = z ciEs 2 E, 
JI= 


. 


1=] 


k k 
= 2 2 c.c¡E,E; 


¡=1=] 


k 2172 
= Y C 1 
t=1 


k 
= Y dE. 


i=1 


MA Aleta limmesal 


ll lector debe comparar esto con 2064), donde f es una matriz diagonal; en ese 
caso (4) ts simplemente la matriz diagonal cuyos clementos de la diagonal 


son L( Á 11 ), - £(A,,,). 
Querriamos. en particular hacer notar que pasa cuando se aplican los poli- 
nomios de Lagrange correspondientes a los escalares Ci. .... €j 


=p 4%, 
ps a, (c; — cs) 


Se tiene p,(c;) = 0;;, lo que quiere decir que 
k 
pi(T) = 2) Es 


= E,. 


Asi las proyecciones E, no solo conmutan con 7. sino que también son poli- 
nomios en 7. 

liales cálculos con los polinomios en 7' pueden ser usados para dar otra 
demostración del Teorema 6 que caracteriza los operadores diagonalizables 
en terminos de sus polinomios minimales. La demostración es enteramente 
independiente de la anterior. 

Si T es diagonalizable. /' =c¡E, + ::* + €, ÉE,. entonces 

IT) = glyEr + --- + glcx)Es. 


para todo polinomio g. Así g(T) = 0 si, y solo sí, g(c,) = O, para todo í. En par- 
ticular, el polinomio minimal de T es 


= (x — c1) --- (x — cx). 


Ahora supóngase que T' sea un operador lineal con polinomio minimal 


p = (x — C1)-**(x — Ci), donde c,, ..., c,¿ son elementos distintos del cuer- 
po escalar. Se forman los polinomios de Lagrange 
(x — ci) 
ps = 1 y 


ij [ej — Ci) 
Recordemos del Capítulo 4 que p;tc¡) = 0; y para cualquier polinomio g de 
grado menor o igual a (k — 1) tenemos 

g = glc)p + -+- + glci)px. 


Tomando g como el polinomio escalar 1 y luego el polinomio ., tenemos 


l=p + --- +pQu 


6-15 
(6 ) T= CP Tb *:* + Cxpx. 


(El lector advertido notará que la aplicación a x puede no ser válida, pues k 
puede ser 1. Pero si k = 1, 7 es un múltiplo escalar de la identidad, por tanto, 
diagonalizable.) Ahora sea E, = p¡(T). De (6-15) tenemos 


Il =E, ++: + És, 


(6-16) T GE, ++ Cl y. 
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Obscrvese que si IE j, entonces pp; es divisible por el polinomio minimal p, 
pues pp, contiene a cada (x — c,) como factor. Así, 


(6-17) EE, = (0, 1]. 


Debemos notar un aspecto más, a saber, que E, + 0, para todo i. Esto es 
porque p es el polinomio minimal de T y así no podemos tener que p;¡(T) = O, 
ya que p, es de grado menor que el grado de p. Este último comentario, junto 
con (6-16), (6-17) y el hecho de que los c, son distintos, permite aplicar el Teo- 
rema 11 para concluir que 7 es diagonalizable. | 


Ejercicios 


1. Sca E una proyección de Y y sea T un operador lineal sobre V. Demostrar que la ima- 
gen de £ es invariante por T si, y solo si. ETE = TE. Demostrar que ambos, la imagen 
y el espacio nulo de E, son invariantes por T si, y solo si, ET = TE. 


2. Sea T el operador lineal sobre R?, cuya matriz en la base ordenada canónica es 


É 1 

0 21 

Sea W, el subespacio de R? generado por el vector e, = (1, 0). 
(a) Demostrar que W, es invariante por T”. 


(b) Demostrar que no existe un subespacio W, que es invariante por T y que es 
complementario de W,: 


R2 = W, OQ W.. 


(Comparar con el Ejercicio 1 de la Sección 6.5). 


3. Sea T un operador lineal sobre un espacio vectorial de dimensión finita. Sea R la ima- 
gen de T y sea N el espacio nulo de 7. Demostrar que R y N son independientes si, y solo 
si. V=RON. 


4. Sea T un operador lineal sobre V. Supóngase que V = W, O : : -: OQ W,, donde cada 
W, es invariante por 7. Sea T; el operador inducido (restricción) sobre W,.. 

(a) Demostrar que det (T) = det (7, ) - - : det (7,.). 

(b) Demostrar que el polinomio característico de T es producto de los polinomios 
característicos de T,, ..., T;. 

(c) Demostrar que el polinomio minimal de T es el mínimo común múltiplo de los 
polinomios minimales de 7,, ..., 7,. (Sugerencia: Demostrar y emplear el hecho corres- 
pondiente para sumas directas de matrices.) 


S. Sea T el operador lineal diagonalizable sobre R? que se examinó en el Ejemplo 3 de 
la Sección 6.2. Usar los polinomios de Lagrange para escribir la matriz representante A 
en la forma A = E, + 2E,, E, + E, = Il, E,E, =0. 


6. Sea A la matriz 4 x 4 del Ejemplo 6 de la sección 6.3. Hallar las matrices E,, E,, E, 
de modo que A =C¡EÉ, + c,E, + C34Ey, E, + E, + E,=l y EE,=0, ¡+4 i. 


7. En los Ejercicios 5 y 6, obsérvese que (para tado ¿) el espacio de vectores propios asocia- 
dos con el valor propio c, es generado por los vectores columna de las matrices E, con j + 1. 
¿Es una coincidencia? 
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8. Sca fun operador lineal sobre Y que conmuta con todo operador proyección sobre Y. 
¿Que se puede decir de T” 
9. Sca V cl espacio vectorial de las funciones reales continuas sobre el intervalo [—1, 1] 
del cje real. Sca W, el subespacio de las funciones pares, f(—x) = f(x), y sea W, el subes- 
pacio de las funciones impares, f(—x) = — f(x). 

(a) Demostrar que Y = W, O W,. 

(b) Si 7 es el operador integración indefinida 


TN = 0 a 


¿son W, y W, invariantes por 7? 


6.8. Teorema de descomposición prima 


Estamos tratando de estudiar un operador lineal 7 sobre el espacio Y de 
dimensión finita, por descomposición de 7' en suma directa de operadores que 
son en cierto sentido elementales. Esto se puede hacer, en ciertos casos especiales, 
por medio de los valores propios y los vectores propios de T'; es decir, cuando 
el polinomio minimal de 7' se puede factorizar sobre el cuerpo de los escalares 
F como producto de polinomios mónicos distintos de grado 1. ¿Qué se puede 
hacer en el caso del T general? Si se estudia T "usando los valores propios, tene- 
mos dos problemas. Primero, T puede no tener un valor propio simple; esto 
us realmente una deficiencia del campo escalar, a saber: que no es algebraicamente 
cerrado. Segundo, incluso si el polinemio característico se puede factorizar 
completamente sobre F, como producto de polinomios de grado 1, puede ser 
que no haya suficientes vectores propios para T' que generen el espacio V; esto 
cs, obviamente, una deficiencia de T. La segunda situación queda ilustrada por 
el operador T en F* (F cualquier cuerpo) representado en la base canónica por 


2 0 0 
A =|1 2 Ol 
0.0 —1 


El polinomio característico para A es (x — 2)(x + 1) y éste es también el po- 
linomio minimal para A (o para T). Así que T' no es diagonalizable. Se ve que 
esto sucede porque el espacio nulo de (7 — 2f) tiene solo dimensión 1. Por 
otro lado, el espacio nulo de (7 + 1) y el espacio nulo de (7 — 21, juntos, 
generan V, siendo el primero, el subespacio generado por €, y el último, el sub- 
espacio generado por €, y €). 

Este será más o menos el método general para el segundo problema. Si (re- 
cuérdese que es una suposición) el polinomio minimal de 7 se descompone en 


p= (x _ c1)": co. (x — C;)" 


donde c;,, ..., €, Son elementos distintos de F, entonces se verá que el espacio 
V es suma directa de los espacios nulos de (7 — c,I Y", i = 1,..., k. La hipó- 
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tesis para p es equivalente al hecho que 7 es triangulable (Teorema $); sin em- 
bargo, ese conocimiento no va a ayudar. 

El teorema que se probará es más general de lo que se ha dicho, ya que es 
aplicable para la descomposición prima del polinomio minimal, sean o no sean 
de primer grado todos los factores primos. Le será de provecho al lector pensar 
en el caso especial cuando los factores primos son de grado 1, y aún más par- 
ticularmente pemsar en la demostración del tipo proyección del Teorema 6, 
un caso especial de este teorema. 


Teorema 12 (teorema de la descomposición prima). Sea T un operador 
lineal sobre el espacio vectorial V de dimensión finita sobre el cuerpo F. Sea p 
el polinomio minimal de T, 


p= pr pe 
donde los p, son polinomios mónicos irreducibles distintos sobre F, y los r, son 
enteros positivos. Sea W, el espacio nulo de p(TY', i = 1, ..., k. Entonces 


(1) Y=W0::0W 

(11) cada E, es invariante por T'; 

(111) si 7; es el operador inducido sobre W; por T, entonces el polinomio mini- 
mal de T, es pi. 


Demostración. La idea de la demostración es la siguiente. Si la descom- 
posición en suma directa (it) es válida, ¿cómo se pueden determinar las pro- 
yecciones E,, ..., E, asociadas a la descomposición? La proyección E; será 
la identidad sobre W, y cero sobre los otros W;. Se encontrará un polinomio 
h, tal que h,(T) es la identidad sobre Y, y es cero sobre los otros W;, con lo que 
AT) + + + hAT) = TI, etc. 

Para todo ti, sea 





f:= L = I p,. 
Pi jri 
Como pj, .-- , p Son polinomiales primos distintos, los polinomios f,, .... fi 


son primos relativos (Teorema 10, Capítulo 4). Así que existen polinomios 
81» ---» Ex tales que 


2 fig; = 1. 


Nótese también que si ¿ 4 j, entonces f,f, es divisible por el polinomio p, pues 
F.f, contiene a cada pf” como factor. Se demostrará que los polinomios h, = 
fig, se comportan del mismo modo descrito al comienzo de la demostración. 

Sea E, = h(T) = f(Mge¡(T). Como h, +:::*+h,=1 y p divide a ff; 
para ¿4 j, se tiene 


EH + Es=1 
E.E, = O, Ss] 1]. 


Con lo que E, son proyecciones que corresponden a una descomposición en 
suma directa del espacio V. Deseamos ahora hacer ver que la imagen de E, es 
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exactamente el subespacio 4. Es claro que cada vector de la imagen de £, está 
en HH; en efecto, sí 2 está en la imagen de £,, entonces a == [ox y asi 


PpD"a 


pil TYkEu 
PTS AD y Da 
0 


pues pf 2, es divisible por el polinomio minimal p. Reciprocamente, supóngase 
que a está en el espacio nulo de p¡(T)Y". Si ¡ = í, entonces f¡g, es divisible por 
pr. con lo que f¡(T)g¡(T)a = O, es decir, Eja = U para ¡+ ¡. Pero entonces 
es inmediato que Exa = x, es decir, que a está en la imagen de E. Esto com- 
plota la demostración de la parte (1) de la tesis. 

Es claro que los subespacios W, son invariantes por 7. Si T, es el operador 
mducido en W, por 7, entonces evidentemente p;(T;)* = O, ya que, por defini- 
ción, pi(T Y" = O en el subespacio W,. Esto muestra-que el polinomio minimal 
de /, divide a pi. Reciprocamente, sea g cualquier polinomio tal que g(7;) = O. 
Entonces g(T)f, (7) = 0. Con lo que gf; es divisible por el polinomio minimal p 
due T; es decir, p'f; divide a gf;. Es fácil ver que p;' divide a g. Luego el polino- 
mio minimal de 7, es pi. | 

Corolario. Si E,, ..., E, son las proyecciones asociadas a la descomposi- 
ción prima de T, entonces todo E, es un polinomio de T, y en consecuencia, si un 
operador lineal U conmuta con T. entonces U commuta com cada uno de los E;; 
es decir, cada subespacio W, es intariante por U. 

Con la notación de la demostración del Teorema 12, consideremos el caso 
especial en que el polinomio minimal de T es un producto de polinomios de 
primer grado; es decir, el caso en que cada p, es de la forma p, = x — c,. Ahora 
la imagen de E; es el espacio nulo W, de (T — c,¡I Y". Hágase D =C E, +-::: + 
c¿E,. Por el Teorema 11. D es un operador diagonalizable que se llama la parte 
diagonalizable de 7. Considérese el operador N = T — D. Ahora 

T= TE, + --- + TE; 
D = uE + --- + CrEs 
asi 


N=(P — aDE + +(7 —- aDNE,. 


11 lector debe estar ya lo suficientemente familiarizado con las proyecciones 
para ver ahora que 


N? =(T — OIPE,4+ + (7 — aL YPEs 
y, en general, que 
N" =(T —= alyE,+ +++ +(T — aL yE,. 


Cuando r > r; para cada í, se tendrá que N” = 0. ya que el operador (7 —c,IY 
será entonces 0 en el recorrido de E). 


Definición. Sea N un operador lineal sobre el espacio vectorial V. Se dice 
que N es nilpotente sí existe un entero positico r tal que N" =0. 
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Teorema 13. Seca T un operador lineal sobre el espacio vectorial V de di- 
mensión finita sobre el cuerpo F. Supóngase que el polinomio minimal de T se 
descompone sobre F, en producto de polinomios lineales. Entonces existen un 
operador diagonalizable D sobre V y un operador N nilpotente sobre V tales que 


(1i) DN = ND. 


El operador diagonalizable D y el operador nilpotente N están univocamente 
determinados por (1) y (11), y cada uno de ellos es un polinomio de T. 


Demostración. Acabamos de observar que se puede escribir T = D+MN, 
donde D es diagonalizable y N nilpotente, y donde D y N no solo conmutan, 
sino que son polinomios de 7. Supóngase ahora que también tenemos T = D' + 
N”, donde D' es diagonalizable, N” nilpotente y D'N' = N'"D”. Demostrare- 
mos que D= D' y N=N”. 

Como D' y N' conmutan entre sí y T = D' + N', se ve que D' y N' con- 
mutan con 7. Asi, D' y N' conmutan con cualquier polinomio de T'; luego 
conmutan con D y con N. Ahora tenemos 


D+4N=D4N 


Y 


D-D'=N-—N 


y todos estos cuatro operadores conmutan entre sí. Como D y D' son ambos 
diagonalizables y conmutan, son simultáneamente diagonalizables, y D — D' es 
diagonalizable. Como N y N' son nilpotentes y conmutan, el operador (N' — N) 
es nilpotente; en efecto, como N y N” conmutan 


WN Ny= 3 (7) (Ny 
j=0 NW 

y así, cuando r es suficientemente grande, cada término en esta expresión de 
(N" — NY será O. (En realidad un operador nilpotente en un espacio de dimen- 
sión n debe tener su potencia n-ésima 0; si se hace arriba r = 2n, será suficien- 
temente grande. Se sigue entonces que r = n es suficientemente grande, pero 
esto no es obvio en la expresión anterior.) Ahora D — D' es un operador dia- 
gonalizable y también nilpotente. Un tal operador es evidentemente el opera- 
dor cero, pues como es nilpotente, el polinomio minimal de este operador es 
de la forma x” para algún r < m; pero entonces, como el operador es diagona- 
lizable, el polinomio mínimal no puede tener raíces repetidas; luego r = 1 y 
el polinomio minimal es simplemente x, lo que dice que el operador es 0. Con 
lo que se tiene que D= D' y N= N'. ] 


Corolario. Sea V un espacio vectorial de dimensión finita sobre un cuerpo 
F algebraicamente cerrado, y. g., el cuerpo de los números complejos. Entonces 
todo operador lincal T sobre V puede escribirse como suma de un operador diago- 
nalizable D y un operador nilpotente N que conmutan. Estos operadores D y N 
son únicos y cada uno es un polinomio de T. 


.y 
E] 
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Por estos resultados se ve que el estudio de los operadores Imecales cn un 
espacio vectorial sobre un cuerpo algebrincamente cerrado queda esenciidmente 
reducido al estudio de operadores nilpotentes. Para espacios vectoriales sobre 
cuerpos no algebraicamente cerrados se debe encontrar todavía un sustituto de 
los valores y vectores propios. Es un hecho muy interesante que estos des pro 
blemas pueden tratarse en forma simultánca, y cello es lo que se hará en el pró 
ximo capitulo. 

Para concluir esta sección queremos dar un ejemplo que ilustre algunas 
de las ideas del teorema de descomposición prima. Hemos preferido darlo al 
final de la sección, ya que se refiere a ecuaciones diferenciales y, por tanto, no 
es exclusivamente de álgebra lineal. 


Ejemplo 14. En el teorema de descomposición prima no es necesario que 
ul espacio vectorial V sea de dimensión finita, ni es necesario para las partes 
(1) y (11) que p sea el polinomio minimal de 7. Si T es un operador lineal sohre 
un espacio vectorial arbitrario y si existe un polinomio mónico p, tal que 
p(T) = O, entonces las partes (1) y (11) del Teorema 12 son válidas para T con 
la demostración que se ha dado. 

Sea n un entero positivo y sea V el espacio de todas las funciones f nh veces 
continuamente derivables sobre el eje real y que satisfacen la ecuación diferencial 





l d"f df dj 
(6-18) dir + 4n-1 apo + --- +45 dl + af = 0 
donde los az, ..., a,-, son constantes dadas. Si C,, representa el espacio de 


las funciones n veces continuamente derivables, entonces el espacio V de las so- 
luciones de esta ecuación diferencial es un subespacio de C,,. Si D representa 
el operador derivación y p es el polinomio 
Pp = 1% + 087 4 +++ 4 iZ + 0 

entonces V es el espacio nulo del operador p(D), ya que (6-18) no dice más que 
ptD)f = O. Por tanto, V es invariante por D. Considérese ahora D como un 
operador lineal sobre el subespacio V. Entonces p(D) = 0. 

Si estamos considerando funciones derivables de valores complejos, enton- 


ces C, y Y son espacios vectoriales complejos, y Ap, . . ., 4, ¡ puede ser cualquier 
número complejo. Escribimos ahora 


p = [lx — ci)” --- (1 — Cc)” 


donde los c,, ..., €, son números complejos distintos. Si W, es el espacio nulo 
de (D — c;¡IY:, entonces el Teorema 12 dice que 


V = WO---0v.. 


Es decir, si f satisface la ecuación diferencial (6-18), entonces f queda univoca- 
mente determinado en la forma 


=h+::+f 


donde las f satisfacen la ecuación diferencial (D — c,IY»f, = 0. Así el estudio 
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de las soluciones de la ccuación (6-18) queda reducido al del espacio de solu- 
ciones de una ecuación diferencial de la forma 


(6-19) (D — cl yf =0. 


Esta reducción se ha efectuado por los métodos generales del álgebra lineal, 
es decir, por el teorema de descomposición prima. 

Para describir el espacio de soluciones de (6-19), se debe conocer algo res- 
pecto a las ecuaciones diferenciales; esto es, se debe conocer algo respecto a 
D. además del hecho de que es un operador lineal. Es muy fácil demostrar, 
por inducción sobre r, que si f está en C,, entonces 

(D — clyf = estDr(e-f) 
esto es, 


D— $ ele, ete. 


Asi, (D — cIYf = Osi, y solo si, D'(e” *f) = 0. Una función g tal que D'g = 0, 
es decir, d'g/dt" = 0, debe ser una función polinomio de grado (r — 1) o menor 


g(t) = bo + bir+ --- + dy tr? 
Asi que f satisface (6-19) si, y solo si, tiene la forma 
FU) = et(bo + bi + --- + 0d, atr5). 


En consecuencia, las «funciones» e”, te, ..., 1 *e* generan el espacio de 
soluciones de (6-19). Como 1, t, ..., 177? son funciones linealmente indepen- 
dientes, y la función exponencial no tiene ceros, estas r funciones te", 0 <¡< 
r — |, forman una base del espacio de soluciones. 

Volviendo a la ecuación diferencial (6-18), que es 


pd) =0 
p = (1 — cy)” --> (a — ca)” 
se ve que las n funciones 1”e%', 0 <m< r;— 1,1 < ¡ < k, forman una base del 


espacio de soluciones de (6-18). En particular, el espacio de soluciones es de 
dimensión finita y tiene dimensión igual al grado del polimomio p. 


Ejercicios 


l. Sea T un operador lineal sobre R? representado en la base ordenada canónica por la 


matriz 
6 —3 — 
4 —1 —2]l- 
10 —5 —: 


Expresar el polinomio minimal p de T en la forma p = p,p», donde p, y p, son polinomios 
mónicos e irreducibles sobre el cuerpo de los números reales. Sea W, el espacio nulo de 
PAT). Hallar las bases 03, para los espacios W, y W,. Si T; es el operador inducido en W, 
por 7, hallar la matriz de 7; en la base (3, (anteriormente citada). 
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2. Seca f el operador lincal sobre R? representado por Lai matriz 


3 1 —i 
2 2 —1I 
2 0 


en la base ordenada canónica. Demostrar que existen un operador diagonalizable D sobre 
R* y un operador nilpotente N sobre R* tales que T= D+ N y DN = ND. Hallar las 
matrices de D y N en la base canónica. (No hay más que repetir la demostración del Teore- 
ma 12 para este caso especial.) 


3. Si Fes el espacio de los polinomios de grado menor o igual que n sobre un cuerpo F, 
demostrar que el operador derivación sobre V es ntlpotente. 


4. Sca T el operador lineal sobre el espacio Y de dimensión finita con polinomio carac- 
leristico 


f = (x — cy ... (z — C;J% 
y poliomio minimal 


p = (1 — c)a --- (1 — Cx)”». 


Sea MW; el espacio nulo de (7 — c,f)". 

(a) Demostrar que Y, es el conjunto de todos los vectores a de V tales que (T — c¡IY"a=0 
para algún entero positivo m (que dependerá de a). 

(b) Demostrar que la dimensión de W, es d,. (Sugerencia: St T, es el operador inducido 
cn W, por 7, entonces 7; — c;¡Í es nilpotente; asi el polinomio característico de T; — c;¿! 
debe ser x“, donde e, es la dimensión de W, (¿demostración ?); así el polinomio caracte- 
ristico de T; es (x — c¡)*: ahora úsese el hecho de que el polinomio característico de T' es 
el producto de los polinomios característicos de los 7;, para demostrar que e; = d;.) 


5. Seca V un espacio vectorial de dimensión finita sobre el cuerpo de los números comple- 
jos. Sca T un operador lineal sobre V y sea D la parte diagonalizable de 7. Demostrar que 
si y cs cualquier polinomio con coeficientes complejos, entonces la parte diagonalizable 
de g(T) es g(D). 


6. Sea V un espacio vectortal de dimensión finita sobre el cuerpo F y sea T un operador 
lincal sobre 7 tal que rango (7) = 1. Demostrar que o bien 7 es diagonalizable o bien T es 
nilpotente, pero no ambas cosas simultáneamente. 


7. Sea V un espacio vectorial de dimensión finita y sea 7 un operador lincal sobre V. Supón- 
gase que T conmuta con cada operador lineal dtagonalizable en Y. Demostrar que 7 es 
un múltiplo escalar del operador identidad. 


8. Sea Y el espacio de las matrices n x n sobre el cuerpo F y sea A una matriz dada n x n 
sobre F. Se define un operador lineal T' sobre Y por T(B) = AB = BA. Demostrar que si 
4 es una matriz nilpotente, 7' es un operador nilpotente. 


9. Dar un ejemplo de dos matrices nilpotentes 4 x 4 con el mismo polinomio minimal 
(necesariamente tienen el mismo polinomio caracteristico), pero que no son semejantes. 


10. Sea T un operador lineal sobre el espacio Y de dimensión finita, sea p = p%' : - - py* el 
polinomio minimal de T y sea V= W, O --- O W, la descomposición prima de T; es 
decir, W; es el espacio nulo de p¡(7'Y”. Sea W cualquier subespacio de V invariante por T. 
Demostrar que 


W=(WAWO(WOANWO--: (WA). 
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M1. ¿Cuál es el error en la siguiente demostración del Teorema 137 Supóngase que el po- 
linomio minimal de 7' sea un producto de factores lineales. Entonces, por el Teorema 5, 
T es triangulable. Sea 03 una base ordenada tal que A = [T7']g es triangular superior. Sea 
D la matriz diagonal con elementos en la diagonal principal a,;, ..., G,,. Entonces A = 
D + N, donde N es estrictamente triangular superior. Evidentemente, N es nilpotente. 


12. Si se meditó en el Ejercicio 11, pensar nuevamente en él, después de observar qué 
dice el Teorema 7 respecto a las partes diagonalizable y nilpotente de 7. 


13. Sea 7 un operador lineal Y con polinomio minimal de la forma p" con p irreducible 
sobre el cuerpo de los escalares. Demostrar que existe un vector a en V tal que el T-anu- 
lador de au es p”. 


14. Usar el teorema de descomposición prima y el resultado del Ejercicio 13 para demos- 
trar lo siguiente. Si 7 es cualquier operador lineal sobre un espacio Y de dimensión finita, 
entonces existe un vector x en Y con T-anulador igual al polinomio minimal de 7. 


15. Si N es un operador lineal nilpotente sobre un espacio de dimensión n, entonces el 
polinomio característico de N es x”. 


7. Las formas racional 
y de Jordan 


7.1. Subespacios cíclicos y anuladores 


Sea nuevamente Y un espacio vectorial de dimensión finita sobre un cuer- 
po F y sea T un operador lineal dado (pero arbitrario) sobre V. Si a es cualquier 
vector de Y, existe un subespacio mínimo de Y que es invariante por T y que 
contjene a a. Este subespacio se puede definir como la intersección de todos 
los subespacios invariantes por T' que contienen a a; sin embargo, es más útil 
por el momento ver las cosas del siguiente modo. Si W es un subespacio de 
Y invariante por 7 y que contiene a a, entonces W debe contener también al 
vector Tx; luego W debe contener a T(Ta) = T*%a, T(T?*a) = T%a, etc. Esto 
es, W debe contener a g(T la para todo polinomio g sobre F. El conjunto de 
todos los vectores de la forma g(T')a, con g en F[x], es evidentemente invariante 
por T, y es así el menor subespacio invariante por T' que contiene a q. 


Definición. Si a es cualquier vector de V, el subespacio T-ciclico generado 
por 2 es el subespacio Zla; T) de los vectores de la forma g(Tj)a, g en F[x]. Si 
Zla: T) = V entonces se dice que a es un vector cíclico de T. 


Otro modo de describir el subespacio Z(a; 7) es que Z(a; T) es el subespacio 
generado por los vectores T*a, k > 0; y así a es un vector ciclico de T si, y solo si, 
estos vectores generan V. Se previene al lector que el operador general T no 
tiene vectores cíclicos. 


Ejemplo 1. Para cualquier 7, el subespacio T-ciclico generado por el vec- 
tor nulo es el subespacio nulo. El espacio Z(a; 7) es de dimensión uno si, y solo 
si, a es un vector propio de 7. Para el operador identidad, todo vector no nulo 
genera un subespacio ciclico unidimensional; asi,. si dim Y > 1, el operador 
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identidad no tiene vector cíclico. Un ejemplo de operador que tiene un vector 
erclico es el operador lmeal / sobre F* que está representado en la base orde- 


vida canónica por la matriz 
0 0 
1.0 


YXWqui el vector ciclico (un vector ciclico) es €, ; en efecto, si fi = (a, h). entonces 
con g = «a + hx se tiene ff = g(T)e,. Para este mismo operador el subespacio 
ciclico generado por €, es el espacio unidimensional generado por €,. pues €, 
“s un vector propio de 7. 

Para cualquier T y x sean las relaciones lineales 


ca + aTa+--* +aTta =00 


entre los vectores T*x. esto es. se consideran los polinomios g = (y FCO Xx ++c c+ 

Fe que tienen la propiedad de que g(T)x = O. El conjunto de todos los 
e en F[x] tales que g(T)z = 0 es claramente un ideal en F[x]. Es también un 
ideal no nulo. va que contiene al polinomio minimal p del operador T(p(T)x = 0 
para todo 2 de J ). 


Definición. Si 2 es cualquier vector de Y. el T-anulador de x es el ideal M(x: T) 
en F[x)] que consta de todos los polinomios g sobre F de modo que g(T Ya = 0. 
Al polinomio mónico único p, que genera este ideal se le Hamará también el T- 
anulador «de 7. 


Como se observó anteriormente. el T-anulador p, divide al polinomio mi- 
nimal del operador 7. El lector debe observar también que grd (p,) > O, salvo 
que y seu el vector cero. 


lcorema ll. Sea 2 un vector no nulo en Y y sea p, el Tramidador de 2. 


(1) El grado de p, cs igual a la dimensión del subespacio ciclico Zla Ti. 
(11) Si el grado de p, es k. entonces los vectores 2%. Ta. T?tx, .... TE y 
forman una base de Ztx: Ti. 
(mm) Si E es el operador lincal en Ztxa: FT) inducido por T. entonces el poli- 
nomio miuumal de U es p,. 


Demostración. Sca g un polinomio sobre el cuerpo F. Se escribe 
9=p9 +T 


donde r =0 0 erd (tr) < erd 1p,) = k. El polmomio p,q está en el T-anula- 
dor de z. M ¿st 


¿Da = (Da. 


Como r = 0 0 erd (r) < k. el vector r(T)x es combmación lincal de los vecto- 
res 2.12... TF ly y como g(T )x es un vector tipico en Z(2; T), esto muestra 
que estos k vectores generan Z(x: T). Estos vectores son. en efecto. linealmente 
mdependientes. va que cualquier relación lineal no trivial entre ellos dará un 
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polmomio g no nulo tal que g(/)x - 0 y prd (2) < prd (p,) que es absurdo. 
Esto demuestra (1) y (10). 

Sca U el operador lincal en (a: ) que se oblienc por restricción de fa 
ese subespacio. Si g es un polinomio sobre f*, entonces 


pal(Ulg(Tja = paí Tlg(T)a 
= «(Dip T)a 
= g(T)0 
= 0. 


Ast, el operador p,(U) aplica cada vector de Z(a; T) en 0 y es el operador cero 
en Z(a; T). Además, si h es un polinomio de grado menor que k, no se puede 
tener /(U) = 0; en efecto, entonces A(U)a = h(T)a = O, que contradice la 
definición de p,. Esto demuestra que p, es el polinomio minimal de U. | 


Una consecuencia particular de este teorema es la siguiente. Si sucede que 
a es un vector cíclico para T, entonces el polinomio minimal de T debe tener 
igual grado que la dimensión del espacio V; luego el teorema de Cayley-Hamilton 
dice que el polinomio minimal de 7 es el polinomio característico de T. Se de- 
mostrará más adelante que para cualquier 7 existe un vector a en Y que tiene 
al polinomio minimal de 7 por anulador. Se deducirá entonces que T' tiene 
un vector cíclico si, y solo si, los polinomios minimal y característico de T son 
idénticos. Pero ello tomará algún trabajo antes de poderlo ver. 

El plan es estudiar el 7 general usando operadores que tienen un vector cí- 
clico. Para ello se considera un operador lineal U, sobre el espacio Y de dimen- 
sión k. que tiene un vector cíclico a. Por el Teorema 1 los vectores a, ..., U*"*a 
forman una base del espacio W, y el anulador p, de a es el polinomio minimal 
de U (y entonces, también el polinomio característico de U). Si se hace a, = U'”*a, 
¡= 1,...,k, entonces la acción de U sobre la base ordenada (6 = fa,,....,0, jes 


Ua; = Qi+1, ¿2=1,...,k—1 
Uax = —Co0%1 — Ci — *** — Ck_10% 


(7-1) 


donde p=C.+C1x+-: "+ Cx-1 +2 La expresión para Ua, se desprende 
del hecho de que p,(U)a = 0, es decir, 
Uta + cr 10'*la + --+ + cUa + ca = 0. 


Esto dice que la matriz de U, en la base ordenada 6, es 


a 


0.0.0 --- 0 —c 
100 -- 0 a 

(7-2) 0.1.0 --- 0 o 
0.0.0 1-0 


La matriz (7-2) se llama la matriz asociada al polinomio mónico p,. 


Teorema 2. Si U es un operador lineal sobre un espacio de dimensión fini- 
ta W, entonces U tiene un vector cíclico si, y solo si, existe una base ordenada 
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de Y en la que U esté representada por la matriz asociada al polinomio mini- 


mal de U. 


Demostración. Antes se observó que si U tiene un vector cíclico, entonces 
existe tal base ordenada de W. Recíprocamente. si se tiene una base ordenada 
li, .... %) de W en la que U esté representada por la matriz asociada a su 
polinomio minimal, es obvio que a, es un vector ciclico de U. | 


Corolario. Si A es la matriz asociada u un polinomio mónico p, entonces p 
es el polinomio minimal y el polinomio característico de A. 


Demostración. Una manera de demostrarlo es hacer que U sea el operador 
lineal sobre F*, representado por 4'en la base ordenada canónica, y aplicar 
el Teorema 1 junto con el teorema de Cayley-Hamilton. Otro método consiste 
en usar el Teorema 1 para ver que p es el polinomio minimal de A y verificar 
por un cálculo directo que p es el polinomio característico de 4. | 


Un último comentario: si T es un operador lineal cualquiera sobre el espa- 
cio Y y a es un vector de V, entonces el operador U que T induce en el subes- 
pacio cíclico Z(a; T') tiene un vector cíclico, que es a. Así, Z(a; T) tiene una base 
ordenada en la cual U está representado por la matriz asociada de p,, T-anu- 
lador de a. 


Ejercicios 


l. Sea 7 un operador lineal sobre F*. Demostrar que un vector no nulo, que no es un 
vector propio de 7, es un vector ciclico de 7. Demostrar luego que o T ticne un vector cí- 
clico o T es un múltiplo escalar del operador identidad. 


2. Sea T el operador lineal sobre R* representado en la base ordenada canónica por la 
matriz 


2 0 0 
o 2 0 
0.0 —1 


Demostrar que T no tiene vector cíclico. ¿Cuál es el subespacio T-íclico gencrado por el 
vector (l, —1, 3)? 


3. Sea T el operador tineal sobre C?* representado en la base ordenada canónica por la 
matriz 


loz 0 
1 2 —1|: 
O 1 1 


Hallar el T-anulador del vector (1, 0, 0). Hallar el 7-anulador de (1, 0, ¿). 


4. Demostrar que si 7? tiene un vector cíclico, entonces 7 tiene un vector cíclico. ¿Es 
verdadero el recíproco? 


5. Sea Y un espacio vectorial de dimensión n sobre el cuerpo F y sea N un operador lineal 
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nilpotente sobre Y. Supóngase que N” * 40 y sea a un vector cualquiera de 3 de modo 
que N” lg + 0. Demostrar que a es un vector cíclico de N. ¿Cuál es exactamente la matriz 
de N en la base ordenada ja, Na, ..., N" aj? 


6. Dar una demostración directa de que si Á es la matriz asociada al polinomio móni- 
co p, entonces p es el polinomio característico de A. 


7. Sca Y un espacio vectorial de dimensión n y sea T un operador lineal sobre V. Supóngase 
que Tes diagonalizable. 
(a) Si 7 tiene un vector ciclico, demostrar que T tiene n valores propios distintos. 
(b) Si T tiene n valores propios distintos, y si [a,,..., a, ) es una base de vectores pro- 
pios de 7, demostrar que 6 = 0, + :*-* +0, es un vector cíclico de 7. 


8. Sca T un operador lineal sobre el espacio vectorial Y de dimensión finita. Supóngase 
que 7' tiene un vector cíclico. Demostrar que si U es un operador lineal cualquiera que con- 
mute con 7, U es un polnomio de 7. 


7.2. Descomposiciones cíclicas - 
y forma racional 


El objeto de esta sección es demostrar que si 7 es un operador lineal arbi- 
trario sobre un espacio Y de dimensión finita, entonces existen vectores a;,...,aA 
en V tales que 


P 


V=ZaT)0Ó --: O Z(a,; T). 


En otras palabras, queremos demostrar que Y es una suma directa de subes- 
pactos T-cíclicos, lo cual mostrará que T' es la suma directa de un número finito 
de operadores lineales, cada uno de los cuales tiene un vector cíclico. El efecto 
de esto será reducir muchos problemas acerca del operador lineal general a 
problemas análogos con un operador que tiene un vector cíclico. El teorema 
que se demostrará (Teorema 3) es uno de los resultados más profundos del 
álgebra lineal y tiene muchos corolarios interesantes. 

El teorema de la descomposición ciclica está estrechamente relacionado 
con el siguiente problema, ¿Qué subespacios W, invariantes por 7, tienen la 
propiedad de que existe un subespacio W”, invariante por 7, tal que V= WO w”? 
Si W es cualquier subespacio de un espacio Y de dimensión finita, entonces 
existe un subespacio W” tal que V = WO W”. En general hay muchos de tales 
subespacios W” y cada uno de ellos se llama complementario de W. Se pregunta. 
¿Cuándo un subespacio invariante por T' tiene un subespacio complementario 
también imvariante por 7? 

Supóngase que Y = W O W”, donde W y W' son invariantes por T, y véase 
entonces qué se puede descubrir respecto al subespacio W. Cada vector ff de 
1 es de la forma f = y + y”, donde y está en W y y' en W”. Si f es un polinomio 
sobre el cuerpo de los escalares, entonces 


FT) = DP) + AD). 
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Como W y W' son invariantes por T, el vector f(T)y está en W y f(T)y' está 
en W”. Por tanto, f(T)f está en W si, y solo si, f(T)y"” = O. Lo que interesa es 
el hecho, aparentemente sin importancia, de que si f(T)f está en W, enton- 


ces AMP = JT). 


Definición. Sea T un operador lineal sobre un espacio vectorial V y seu W un 
subespacio de V. Se dice que W es T-admisible sí 


(1) W es invariante por T'; 

(11) si (MP está en W, existe un vector y en W tal que (Df = FT). 

Como acabamos de mostrar, si W es invariante y tiene un subespacio in- 
variante complementario, entonces W es admisible. Una de las consecuencias 
del Teorema 3 será el recíproco, de modo que la admisibilidad caracterizará 
aquellos subespacios invariantes que tienen subespacios invariantes comple- 
mentarios. 

Indiquemos cómo la propiedad de la admisibilidad está implicada en la 
intención de obtener una descomposición 


V =Z(a; TIO: O Z(a,; T). 


El método básico para llegar a tal descomposición será seleccionar los vec- 
tores %,, ..., 0, por inducción. Supóngase que, por un proceso u otro, se hayan 
seleccionado %,, ..., Aj, Y QUe 


W;,= Z(a; T)+ --: + Z(a;; 1) 
sea un subespacio propio. Se desea encontrar un vector no nulo a, + 1 tal que 
W;iN Z(aj; T) = (0) 


porque el subespacio W,,, = W, O Zla;+,; T) será entonces al menos una 
dimensión más cercana al espacio Y que se descompone. Pero ¿por qué debe 
existir tal vector a;,,? Si %,, ..., a;, han sido elegidos de modo que W); sea 
un subespacio T-admisible, entonces es relativamente fácil ver que se puede 
encontrar un a;,, adecuado. Esto es lo que hará posible la demostración del 
Teorema 3, aun cuando no expresemos así el razcnamiento fraseado. 

Sea W un subespacio propio invariante por T. Se desea encontrar un vec- 
tor a, no nulo, tal que 


(7-3) WN Zla; T) = (0). 


Se puede elegir un vector ff que no está en W. Considérese el T-conductor S(fB; W), 
que consta de todos los polinomios g tales que e(T)f está en W. Se recuerda 
que el polinomio mónico f = s(f; VW) que genera el ideal S(f; W) es llamado 
también el T-conductor de $ en W. El vector f(TYf está en W. Ahora, si W es 
T-admisible, existe un y en W con f(D)f = F(T)y. Sea a = Pf — y y sea g un 
polinomio cualquiera. Como f — y está en W, g(T)f6 estará en W si, y solo si, 
g(TDla está en W; en otras palabras, S(a; W) = S(f; W). Con lo que el poli- 
nomio f es también el T7-conductor de a en W. Pero f(T)a = O. Ello dice que 
g(TD)a está en VW si, y solo si, g(T)a = 0; es decir, los subespacios Z(a; T) y W son 
linealmente independientes (7-3) y f es el T-anulador de «. 
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Feorema 3 (teorema de descomposición cíclica). Sea T un operador lineal 
sobre un espacio vectorial de dimensión finita V y sea W, un subespacio propio 
I-admisible de Y. Existen vectores no nulos 9, ..., 2, en Y con T-anuladores 
rFespectitos Pis -.., Pp, tales que 


(1) J = Wo O Za DO: 0 Z(0,; DT: 
(11) p, divide a py, k=2,..., F. 


Más aún, el entero r y los anuladores p,, ..., p, están univocamente determi- 
nados por (1), (1) y el hecho de que ninguno de los a, es 0. 


Demostración. La demostración es bastante larga, razón por la cual la 
dividiremos en cuatro partes. Para la primera lectura parece más fácil tomar 
MU, = (0;, aun cuando no produzca una simplificación sustancial. En toda 
lia demostración se abreviará f(T)f por /f. 


Parte 1. Existen vectores no nulos f,, ..., P, en V tales que 


(a) Y = Wo + ZIP: Deo +2%Z(P,: DT); 
(b)sil<k<r y 


W, = Wo + ZIP: TI) + +: + Z(P.: T) 


entonces el conductor p, = SB; W,-1,) tiene el grado máximo entre todos los 
-conductores en el subespacio W,-_,; es decir, para todo k 
grd p, = max grd sla: W, 1) 
1en $ 


Esta parte depende solo del hecho de que W, es un subespacio invariante. 
Si M' es un subespacio propio invariante por T, entonces 


O < max grd sía; W) < dim V 


y se puede elegir un vector ff de modo que grd s(f$; W) alcance tal máximo. El 
subespacio W + Z(f; T) es entonces invariante por T' y tiene dimensión mayor 
que dim W. Aplicando este proceso a W = W, se tiene ff,. Si W, = W, + 
Z(f$,; T) es aún propio, entonces aplicando el proceso a W, se obtiene f/,. Se 
continúa de esta forma. Como dim W, > dim W,_ ,, se debe alcanzar W, = V 
en no más de dim V etapas. 

Parte 2. Sean fB,, ..., f, vectores no nulos que satisfacen las condiciones 
(a) y (b) de la parte 1. Se fija k, 1 < k < r. Sea fB un vector cualquiera de V y 
sea f= s(B; W,-1). Si 


P=Po.+ 2 2,8, Pp; en VW, 
l<i<A 


entonces f divide a cada polinomio g; y Po = fyo, donde y, está en Wo. 
Si k = 1, ello es justamente la afirmación de que W, es T-admisible. Para 
demostrar la afirmación para k > 1, se aplica el algoritmo de la división: 


(7-4) 2, = fh,+*",, 1 =0 0  grdr;< grd f. 


Queremos mostrar que .r,; = O para todo /. Sea 
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k-1 
(1-5) Y=B-— Y his. 

1 
Como y — fi está en W,, 


sy; Wi) = s(B; Wi) = f. 
Además. 


k—1 
(1-6) fy = Bo + 2 r:Bs. 


Supóngase que algún r, es distinto de 0. Se llegará a una contradicción. Sea f el 
mayor índice í para el que r, + 0. Entonces 


(1-7) Fr = Bo + E ribs riX0UO y erd r; < grd f. 


Sea p = sl: W;- ,). Como W,- , contiene a W;. ,, el conductor f = s(y; W,- 1) 
debe dividir a p: 


p = $9. 
Aplicando g(T) a ambos miembros de (7-7): 
(1-8) pr = gy = griBj+ 9604 Y gribi. 
1<i<j 


Por definición, py está en W),..,, y los dos últimos términos del segundo miem- 
bro de (7-8) están en W;. ,. Por tanto. gr;f5, está en W;_,. Ahora. por la condi- 
ción (b) de la parte 1: 


grd (gr;) > grd s(fBj: W;_,) 
= grd p, 
> erd s(y; W;_ 1) 
= grd p 
= erd (fg). 


Con lo que grd r;, > grd f, y ello contradice la elección de j. Se sabe ahora que 
f divide a cada g, y luego que ff, = fy. Como W, es T-admisible, Ph. = fyo, 
donde ;. está en W¿. De paso notamos que la parte 2 es una reafirmación de 


la observación de que cada uno de los subespacios W,, W,, ..., W, es T-ad- 
misible. 

Parte 3. Existen vectores no nulos a,. ...., a, en V que satisfacen las con- 
diciones (1) y (1) del Teorema 3. 

Se comienza con los vectores ff. .... f,. como en la parte 1. Fijo k, 


lI<k<r, se aplica la parte 2 al vector f = fi, y al T-conductor f = pj. 
Obtenemos 


(7-9) PiBx = Pero + 2 DpxhiB: 
1<i<k 


donde y, está en W, y los h,, ..., h,-, son polinomios. Sea 


(7-10) 0 =Bi—=Y— 2 his. 
1<i<k 
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Como ff, — 2 esta en Hoy, 

(7-11) slar; Wi) = s(Br; Wi-1) = pe 
y como pi% = U, se tiene 

(7-12) Wir N Zar; T) = (0). 


Como cada 2, satisface (7-11) y (7-12), se sigue que 


W, = WO Z(a; T)O -:: O Z(0; T) 


y que p, €s el T-anulador de %,. En otras palabras, los vectores %,. .... x, de- 
finen la misma sucesión de subespacios W,. W,, ... que los vectores f,..... P, y 
los T-conductores p, = s(2%,; W, ,) tienen las mismas propiedades maximales 
[ condición (b) de la parte 1]. Los vectores x,....., x, tienen además la propie- 
dad de que los subespacios Wo, Z(x,: T). Ztx,: T), ... son independientes. 
Es, por tanto, fácil verificar la condición (11) en el Teorema 3. Como p;,%, = 0 
para todo ¿, se tiene la relación trivial 


PrOx =U + pio + -++ 5 pro10a-1. 


Aplicando la parte 2 con los f,, ..., fó, remplazados por los %,..... %, y con 
ff = 2, se tiene como conclusión que p, divide a cada p,. con í< k. 


Parte 4. El número + y los polinomios P,. .... p, están unitocamente de- 
terminados por las condiciones del Teorema 3. 

Supóngase que además de los vectores a,, .... x, en el Teorema 3, se tengan 
vectores no nulos y,..... 7, con los respectivos T-anuladores g,,...., g,, tales que 


(7-13) V=WO0ZNDO---OZG.T) 
ga divide Qx—1», k = 2, o. 8. 


Se demostrará que r = s y que p;, = g, para todo ¡. 

Es fácil ver que p, = £,. El polinomio g, está determinado por (7-13) como 
el T-conductor de Jen W¿. Sea S(V; W,) la colección de polinomios f tales 
que ff esté en W, para cada fí en V; es decir, los polinomios f tales que la ima- 
gen de f(T') esté contenida en W,. Entonces S(H; W¿) es un ideal no nulo cn 
el álgebra de los polinomios. El polinomio g, es, por esta razón, el generador 
mónico de ese ideal. Todo ff de V tiene la forma 


B= Borfvt+ :- +f.7 
y asi, 


YB = Y Bo + z YÍ:vi. 


Como cada g, divide a g,, se tiene que g,y, = 0 para todo ¡y g,f$ = g,f, está 
en W,. Con lo que g, está en S(V; W¿). Como g, es el polinomio mónico de 
menor grado que aplica ;, en M?,, se ve que g, es el polinomio mónico de menor 
grado en el ideal S(V: W,). Por el mismo razonamiento, p, es el generador 
de tal ideal, con lo que p;, = g;. 
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Si f es un polinomio y W es un subespacio de V, usaremos la expresión 
abreviada /M para el conjunto de todos los vectores fa con x en W. Se deja 
para los ejercicios la demostración de los siguientes tres hechos: 


l. fZ<(a: T)= Zlfxa; T). 

2. Si U=V,GB6:::0O !;,. donde cada Y, es invariante por T, entonces 
== 0 O: :O/f. 

3. St x y y tienen el mismo 7-anulador, entonces fx y fy' tienen el mismo 
T-anulador y (por tanto) 


dim Z(fa; T) = dim Z(fy; 7). 


Ahora se procede por inducción para ver quer = syp, = g parai=2,...,r. 
El razonamiento consiste en contar las dimensiones en la forma correcta. Se 
dará la demostración de que si r > 2, entonces p, = g,. y con ello la inducción 
será clara. Supóngasc que r > 2. Entonces 


dim Wo + dim Z(a1; TY < dim V. 


Como se sabe que p, = 2,. se sabe que Z(x,: T) y Z(5y,: T) tienen la misma 
dimensión. Por tanto. 


dim Wo + dim Z(y1; 7) < dim V 


lo que muestra que 4 > 2, Ahora tiene sentido preguntarse si cabe o no p,= £,. 
De las dos descomposiciones de Y se obtienen dos descomposiciones del subes- 
pacio p,Í:: 


pV = pWoO Z(pz01; T) 
2 =p MO Zip DO: O Zípars; 7). 


Hemos usado los hechos (1) y (2) anteriores y el hecho de que px, = 0, 
¡> 2 Como se sabe que p, = g,. (3), anteriormente mencionado, dice que 
Z(p221: Td y Ztp>y1. T) tienen la misma dimensión. Luego se desprende de 


(7-14) que 


(7-14) 


dimZ(pY;T)=0,  1>2. 


Concluimos que py, = 0 y que e, divide a p,. El razonamiento puede inver- 
tirse para demostrar que p, divide a g,. Por tanto, p, = g,. | 


Corolario. Si T es un operador lincal sobre un espacio vectorial de dimensión 
finita. entonces todo subespacio Toadmisible tiene un subespacio complementario 
que es también intariante por T. 


Demostración. Sea WQ un subespacio admisible de Y. Si W, = V, el com- 
plemento que se busca es $0;. Si MW, es propio, se aplica el Teorema 3 y se hace 
Wo =Z(a DO --: O Zí(as; T). 

Entonces MW es invariante por Ty V=W.G0W. II 


Corolario. Seca T un operador lincal sobre un espucio vectorial Y de dimen- 
sión finita. 
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(a) Existe un vector a en V tal que el Tranulador de 2 es el polinomio 
minimal de T. 

(b) T tiene un vector ciclico si, y solo si, los polinomios característico y mi- 
nimal de T son idénticos. 


Demostración. Si V = [0), los resultados son trivialmente verdaderos. Si 
1H 10!, sea 


(7-15) Y = Z(a; T) O --- OZ(0,; T) 


donde los T-anuladores p,, . . ., p, son tales que p,_ , divideap,.1<k<r-— 1. 
Como observamos en la demostración del Teorema 3, se sigue fácilmente que 
p, es el polinomio minimal de 7, es decir, el T-conductor de V en (0j. Con ello 
se ha demostrado (a). 

Vimos en la Sección 7.1 que si T7' tiene un vector ciclico el polinomio mint- 
mal de 7 coincide con el polinomio característico. El contenido de (b) está en 
el recíproco. Se elige un a cualquiera, como en (a). Si el grado del polinomio 
minimal es dim V, entonces V = Z(a; T). | 


Teorema 4 (teorema de Cayley-Hamilton generalizado). Sea T un opera- 
dor lineal sobre un espacio vectorial V de dimensión finita. Sean p y f los poli- 
nomios minimal y característico de T, respectivamente. 


(1) p divide a f; 
(11) p y f tienen los mismos factores primos, salvo multiplicidades. 
(11) Si 


(7-16) p= he e Me 
es la factorización prima de p, entonces 
(7-17) f= fu --- fue 


donde d, es la nulidad de f(TY* dividida por el grado de f. 


Demostración. No se considera el caso trivial Y = (0%. Para demostrar 
(1) y (11) se considera una descomposición cíclica (7-15) de V, que se obtiene 
del Teorema 3. Como observamos en la demostración del segundo corolario, 
pi = p. Sea U, la restricción de Ta Z(a;; T). Entonces U, tiene un vector cícli- 
co, y así p, es el polinomio minimal y el polinomio característico de U,. Por 
tanto, el polinomio característico f es el producto f = p,,...., p,. Esto es evi: 
dente por la forma bloque de (6-14) que la matriz de T' toma en una base apro- 
piada. Evidentemente, p, = p divide a f, y ello demuestra (i). Es claro que cual- 
quier divisor primo de p es divisor primo de f. Reciprocamente, un divisor 
primo de f = p, : : : p, debe dividir a uno de los factores p, que a su vez divi- 
de a pj. 

Sea (7-16) la factorización prima de p. Se emplea el teorema de descompo- 
sición prima (Teorema 12 del Capitulo 6) que dice que, si Y, es el espacio nulo 
de f.(TY*, entonces 


(7-18) V=V0---O7, 
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y f es el polinomio minimal del operador 7;, obtenido por restricción de 7' al 
subespacio (invariante) V,. Se aplica la parte (11) del presente teorema al opera- 
dor 7, Como su polinomio minimal es una potencia del primo f;. el polinomio 
característico de T; tiene la forma f?, donde d, > r,. Evidentemente 


_ dim V, 
 grdf 
y (casi por definición) dim Y, = nulidad f(TY*. Como T es la suma directa de 
los operadores T,, ..., T,, el polinomio característico f es el producto 
f = fi ... a ¡ 


Corolario. Si T es un operador lineal nilpotente sobre un espacio vecto- 
rial de dimensión n, entonces el polinomio característico de T es x”. 


Se desea ver ahora el análogo del teorema de descomposición cíclica para 
matrices. Si se tiene el operador T y la descompositión en suma directa del 
Teorema 3, sea GB, la «base ordenada ciclica» 


las, Ta;, ..., T*i—1a;) 
para Z(a,; T). Aquí k, representa la dimensión de Z(a,; T'), esto es, el grado 


- del anulador p;. La matriz del operador inducido 7; en la base ordenada G, es 
la matriz asociada del polinomio p,. Así, si se hace que (3 sea la base ordenada 


de Y que es la unión de las (3, dispuestas en el orden G,,..., G,, entonces la 
matriz de T en la base ordenada (3 será 

AL 0 -- 0 
(7-19) a=|o f£ "2 

o 0 A, 


donde A, es la k, x k; matriz asociada de p;. De una matriz n x n, A, que es 
la suma directa (7-19) de matrices asociadas de polinomios mónicos no esca- 
lares py, ..., Pp,, tales que p;¡+, divide a p; para ¿= 1,...,r— l, se dice que 
está en forma racional. El teorema de descomposición cíclica dice lo siguiente 
respecto a las matrices. 


Teorema 5. Sea F un cuergo y sea B una matriz n x n sobre F. Entonces 
B es semejante sobre el cuerpo F a una, y solo a una, matriz que está en forma 
racional. - 


Demostración. Sea T el operador lineal sobre F” representado por B en 
la base ordenada canónica. Como acabamos de observar, existe una base or- 
denada de F” en que T está representado por una matriz A en forma racional. 
Entonces B es semejante a esta matriz A. Supóngase que B es semejante sobre Fa 
otra matriz C que está en la forma racional. Esto quiere decir simplemente 
que existe una cierta base ordenada de F” en la que el operador T' está repre- 
sentado por la matriz C. Si C es la suma directa de matrices asociadas C, de 
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polinomios mónicos £,, .... £, tal que £,,, divide a £, parai=5h...,.s— |, 
entonces es evidente que se tienen vectores f$,, ..., f$,, no nulos, en Y con T- 
anuladores £,, .... g, tales que 


V =Z(6: DO: O 2Z(8,; T). 


Pero por la unicidad del teorema de descomposición cíclica, los polinomios 
g, son idénticos a los polinomios p, que definen la matriz 4. Asi, C= A. | 


Los polinomios p,, . .., p, son llamados los factores invariantes de la matriz 
B. En la Sección 7.4 se describirá un algoritmo para calcular los factores inva- 
riantes de una matriz dada B. El que sea posible calcular estos polinomios por 
medio de un número finito de operaciones racionales en los elementos de B, 
cs la razón por la cual la forma racional recibe ese nombre. 


Ejemplo 2. Supóngase que V es un espacio vectorial bidimensional sobre 
el cuerpo F, y T sea un operador lineal sobre V. Las posibilidades de descom- 
posición cíclica en subespacios para T' son muy limitadas. En efecto, si el poli- 
nomio minimal de T es de grado 2, es igual al polinomio característico de T. 
y T tiene un vector ciclico. Así que existe cierta base ordenada de V en la que 
T' está representado por la matriz asociada de su polinomio característico. Si, 
por otro lado, el polinomio minimal de T es de grado 1, T es un múltiplo escalar 
del operador identidad. Si T = cf, entonces para dos vectores linealmente 
independientes cualesquiera, a, y a,. en V, se tiene 


V = Z(a1; 7) O Z(02; T) 
P1= pP2=U—C. 


Para matrices, este análisis dice que toda matriz 2 x 2 sobre el cuerpo F es 
semejante sobre F exactamente a una matriz de los tipos 


o cy Lia] 


Ejemplo 3. Sea T el operador lineal sobre R* representado por la matriz 


5 —6 —6 
A =|-—1 4 2 
3 —6 -—4 


en la base ordenada canonica. Se ha calculado antes que el polinomio carac- 
terístico de T es f = (x — 1Mx — 2), y que el polinomio minimal de T es 
p =(x — IMx — 2). Asi se sabe que cn la descomposición ciclica de T el primer 
vector x, tendrá a p como T-anulador. Como se ha operado en un espacio 
tridimensional, puede haber solo otro vector. x,, el cual debe generar un sub- 
espacio cíclico de dimensión 1, cs decir, debe ser un vector propio de T. Su T- 
anulador p, debe ser (x — 2), ya que debemos tener que pp, = f. Obsérvese 
que esto dice inmediatamente que la matriz A es semejante a la matriz 


0 -2 0 
B=|1 3 0 
0 0 2 
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esto es, que 7 está representado por B cn alguna base ordenada. ¿Cómo se 
pueden encontrar los vectores adecuados a, y a, ? Bien, sabemos que cualquier 
vector que genera un subespacio T-cíclico de dimensión 2 es un vector ade- 
cuado x,. De modo que sea €e,. Tenemos 


Tea = (5, —1, 3) 


que no es un múltiplo escalar de €,; luego Z(e,; 7) tiene dimensión 2. Este 
espacio consta de todos los vectores a€, + b(Te€, ): 


a(1, 0, 0) + d(5, —1,3) = (a + 5b, —b, 3b) 


o todos los vectores (x,, Xx,, x3) que satisfacen xz = —3x,. Ahora lo que se 
desea es un vector a, tal que Ta, = 29, y Zl(a,; T) es disjunto de Z(a,; 7). 
Como a, es un vector característico para T, el espacio Z(a,; T') será simplemente 
el espacio unidimensional generado por a,, y así, lo que se requiere es que a, 
no esté en Z(a,; 7). Si a = (x,, Xx, X3), se puede fácilmente calcular que 
Ta = 2a si, y solo si, x, = 2x, + 2x3. Así, a, = (2, 1, 0) satisface Ta, = 20, 
y genera un subespacio T-cíclico disjunto de Z(a,; 7). El lector podrá verificar 
directamente que la matriz de T' en la base ordenada 


(1, O, 0), (5, —1, 3), (2, 1, 0) 


es la matriz B anteriormente mencionada. 


Ejemplo 4. Supóngase que T' es un operador lineal diagonalizable so- 
bre V. Es interesante relacionar una descomposición cíclica de T' con una base 
que diagonaliza la matriz de T. Sean c,, ..., Cj los valores propios ¿distintos 
de T, y sea V, el espacio de los vectores propios asociados con el valor carac- 
terístico c,. Entonces 


V=V0---OQ7 
y sí d, = dim V,, entonces 
f = la — cyy% .... (zx -— C1)2 
es el polinomio característico de 7. Si qa es un vector de Y, es fácil relacionar 
el subespacio cíclico Z(a; T) con los subespacios V,, ..., Y, Existen vectores 
Bi, .--. Ph Únicos, tales que f, está en V,, y 


a = 61 + --* + Br. 


Como Tf; = c;¡f;, se tiene 


(7-20) HKD] = fla)Br + -:- + fer) Bs 

para todo polinomio f. Dados escalares arbitrarios f,, ..., f,, existe un polt- 
nomio f tal que f(c;) = t;, l < ¡ < k. Por tanto. Z(a; T) es justamente el sub- 
espacio generado por los vectores ff,, ..., fi. ¿Cuál es el anulador de a? De 


acuerdo con (7-20) se tiene f(T)a = O si, y solo sí, f(c¡)f$; = O para cada /. En 
otras palabras, f(T)a = O siempre que f(c¡) = O para cada í tal que f, + O. 
En consecuencia, el anulador de a es el producto 


40 Alvelra lime 


(7-21) M (cc). 
8/0 
Ahora, sean (B, = [fB. .... ff una base ordenada de ),. Sea 
= max ds. 
Se definen los vectores %,, ..., A, Por 
(7-22 aj= Y B), 1<3<r. 
di>j 


Il subespacio cíclico Z(a;,; 7) es el subespacio generado por los vectores f%, 
cuando ¿ describe los índices para los cuales d, > j. El T-anulador de a, es 


(7-23) Pj = TI (z — Ci). 


di>j 
Se tiene 
V=Z(a;T)OD ::: O Z(a,; T) 
pues cada f5; pertenece a uno, y solo a uno, de los subespacios Z(a,; T), ..., 


/(2,: TD), y B=(GB,, ..., (B,) es una base ordenada de V. Por (7-23), p;,, 
divide a pj. 


Ejercicios 


l. Sca T el operador lineal sobre F? representado en la base ordenada canónica por la 


mutriz 
bh 0 
1.0 


Sea x, = (0, 1). Demostrar que F? + Z(a,; T) y que existe un vector a,, no nulo, en F? 
con Z(a,; T) disjunto de Z(a,; 7). 


2. Sca T un operador lineal sobre el espacio Y de dimensión finita y sea R la imagen 
por T. 

(a) Demostrar que R tiene un subespacio 7-invariante complementario si, y solo si, 
R es independiente del espacio nulo N de 7. 

(b) Si R y N son independientes, demostrar que N es el subespacio único T-invariante 
complementario de R. 


3. Sea T el operador lineal sobre R? representado en la base ordenada canónica por la 


matriz 
200 
12 01h 
0.03 


Sea W el espacio nulo de T — 2/. Demostrar que W no tiene subespacio T-invariante com- 
plementario. (Sugerencia: Sea [$ = €, y Obsérvese que (7 — 21)f$ está en W. Demostrar 
que no existe a en W con (7 — 2D)f = (T — 21 ha.) 


4. Sea T el operador lineal sobre F* representado en la base ordenada canónica por la 
matriz 
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Oo -_ o 
o oc 
== 0 O= 
¡ao o o 


Sea W el espacio nulo de YT — cl. 
(a) Demostrar que W es el subespacio generado por €,. 
(b) Hallar el generador mónico de los ideales S(a¿; W), Sla,; W), Síla,; W) y Sía, ; W). 


5. Sea T un operador lineal sobre el espacio vectorial sobre el cuerpo F. Si f es un poli- 
nomio sobre F y a está en V, sea fa = f(T)a. Si V,, ..., V, son subespacios invariantes 
bajo Ty V=V,0 ::: O V, demostrar que 


NM=IVO:DfVr. 


6. Sean T, V y F como en el Ejercicio 5. Supóngase que a y f son vectores en Y que tienen 
el mismo 7-anulador. Demostrar que, para cualquier polinomio f, los vectores fa y ff 
tienen el mismo 7-anulador. 


7. Hallar los polinomios minimales y las formas racionales de cada una de las siguientes 
matrices reales 


O —1 —1 c 0 —1l cos O sen 6 
1 0 O | O c 1 |, o 0 . 
1.0.0 11 c cos 


8. Sea T el operador lineal sobre R?* representado en la base ordenada canónica por 


3 —4 -—4 
—] 3 2) 
2 -—4 — 


Hallar los vectores no nulos %,, ..., 0, que satisfacen las condiciones del Teorema 3. 


1 3 3 
A = 3 1 3 
-3B 3 — 


Hallar una matriz real 0, inversible, tal que P7*AP esté en la forma racional 


9. Sea A la matriz real 


10. Sea F un subcuerpo de los números complejos y sea T el operador lineal sobre F* 
representado en la base ordenada canónica por la matriz 


20050 
120001 
0a 2.0 
00b2 


Hallar el polinomio característico de 7. Considerar los casosa =b=1,a=b=0.a=0, 
b = 1. En cada uno de los casos, hallar el polinomio minimal de T y los vectores %,, ....4,, 
no nulos que satisfacen las condiciones del Teorema 3. 


11. Demostrar que si A y B son matrices 3 x 3 sobre el cuerpo F, una condición nece- 
saria y suficiente para que A y B sean semejantes sobre F' es que tengan el mismo polinomio 


2H) dlecha mal 


(==0 y Em 
Ahora, scan 6, = (Bl, .... f,] una base ordenada de Y. Sea 
= max d;. 
Se definen los vectores Aj, -... A, por 
(1-22 aj = eS Bs, 1<j3<r. 


I:l subespacio cíclico Z(x;; T) es el subespacio generado por los vectores f;, 
cuando ¡ describe los indices para los cuales d, > ¡. El T-anulador de a, es 


(7-23) py = 1 (z — ci). 


di>j 
Se tiene 
V =Z(a;T)OD --: O Z(a,; T) 
pues cada pi pertenece a uno, y solo a uno, de los subespacios Zí(a,; T), ..., 


/(a,: T) y B=(GB,, .--» B,) es una base ordenada de Y. Por (7-23), p; 
divide a p). 


Ejercicios 


l. Sea T el operador lineal sobre F* representado en la base ordenada canónica por la 


matriz 
h 0 , 
1.0 


Sea a, = (0, 1). Demostrar que F? 4 Z(a,; T) y que existe un vector a,, no nulo, en F? 
con Z(a,; T) disjunto de Z(x,; 7). 


2. Sea T un operador lineal sobre el espacio Y de dimensión finita y sea R la imagen 


or T. 
j (a) Demostrar que R tiene un subespacio T-invariante complementario si. y solo si, 
R es independiente del espacio nulo N de 7. 
(b) Si R y N son independientes, demostrar que N es el subespacio único T-invariante 
complementario de R. 


3. Sea T el operador lineal sobre R” representado en la base ordenada canónica por la 


matriz 
20.0 
035 
0.03 


Sea W el espacio nulo de 7 — 2/. Demostrar que W no tiene subespacio T-invariante com- 
plementario. (Sugerencia: Sea $ = €, y obsérvese que (7 — 2/1)f está en W. Demostrar 
que no existe a en W con (7 — 21)f$ = (T — 21)a.) 


4. Sea T el operador lineal sobre F* representado en la base ordenada canónica por la 
matriz 
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O0-0o 
O - 00 
> 0 DO 
a OS 


Sea W el espacio nulo de FT — cl. 
(a) Demostrar que W es el subespacio generado por €s. 
(b) Hallar el generador mónico de los ideales S(a,; W), Sla,; W), Sía,; W) y Sla, ; W). 


5. Sea T un operador lineal sobre el espacio vectorial sobre el cuerpo F. Si f es un poli- 
nomio sobre F y au está en V, sea fa = f[Tla. Si V,, ..., V, son subespacios invariantes 
bajo Ty V=V, 0: O V,, demostrar que 


fV=$f$ÑVO-DOÍfV:. 


6. Sean T, V y F como en el Ejercicio 5. Supóngase que a y f$ son vectores en V que tienen 
el mismo 7-anulador. Demostrar que, para cualquier polinomio f, los vectores fa y f6B 
tienen el mismo 7-anulador. 


7. Hallar los polinomios minimales y las formas racionales de cada una de las siguientes 
matrices reales 


0 -1 -1 c 0 -1 cos O sen $ 
o ob 0c 1) o 9 
1.0.0 —1 1 cos 


€ 


8. Sea T el operador lineal sobre R? representado en la base ordenada canónica por 


3 —4 —4 
—1 3 2 |- 
2 -—4 — 


Hallar los vectores no nulos a,, ..., a, que satisfacen las condiciones del Teorema 3. 


1 3 3 
A = 3 1 3 
3 —3 —5 


Hallar una matriz real 0, inversible, tal que P7*AP esté en la forma racional 


9. Sea A la matriz real 


10. Sea F un subcuerpo de los números complejos y sea T' el operador lineal sobre F* 
representado en la base ordenada canónica por la matriz 


2000 
12001 
002.0 
0002 


Hallar el polinomio característico de 7. Considerar los casosa =b=1l,a=b=0,a=0, 
b = 1. En cada uno de los casos, hallar el polinomio minimal de 7 y los vectores a,,..., ,, 
no nulos que satisfacen las condiciones del Teorema 3. 


11. Demostrar que si A y B son matrices 3 x 3 sobre el cuerpo F, una condición nece- 
saria y suficiente para que A y B sean semejantes sobre F es que tengan el mismo polinomio 


> Huetar din al 


Caracteristico y el mismo poliiomio amamal. Dar un ejemplo que ntuestte que estos DLalso 
para mitrces 4 x 4, 


12. Sea E uu subcuerpo del cuerpo de los numeros complejos y seat Es 3 matices 1 21 
sobre E. Demostrar que se 4 y B son semejantes sobre el cuerpo de los numeros complejos. 
sor semejattes sobre E (Sugerencia: Demostrar que la forma racional de Les la misma 
s9se considera 4 como matriz sobre F o como matriz sobre C: do misme para B) 


IB. Sca 4 una matriz 4 x n de elementos complejos. Demostrar que s1 todo valor propio 
de 4 es real, A es semejante a una matriz de clementos reales. 


14. Sea 7 un operador lincal sobre el espacio 1 de dimensión fimta. Demostrar que existe 
un vector x en Econ esta propiedad: Si f es un polinomio y /(F)x = 0. entonces AT) = 0 
(hal vector x se llama un vector separador para el álgebra de los polinomios en 7.) Cuando 
/ tiene un vector ciclico, dar una demostración directa de que cualquier vector cíclico es 
us vector separador para el álgebra de los polinomios en 7. 


IS. Sca F un subcuerpo del cuerpo de los números complejos y sea 4 una mutniz 1 =$. 
sobre E. Sea p el polinomio minimal para A. St se considera a 4 como matriz sobre CU. enton- 
cos 4 tiene un polinomio minimal / como matriz n x n sobre C. Usar un teorema sobre 
ecuaciones lineales para demostrar que p = f. ¿Se puede ver también cómo se deduce 
esto del teorema de descomposición ciclica” 


l6. Sca 4 una matriz a x n con elementos reales tal que 4% + / = 0 Demostrar que 
nes par y. sia = 2k, entonces A cs semejante sobre el cuerpo de los números reules a una 


| ] 
1 0 


donde / es la matriz unidad Ak x k. 


17. Seca TF un operador lincal sobre un espacio vectorial $ de dimension fimta. Supónga- 
se que 

ta) el polinomo minimal de 7 cs una potencia de un polmomio irreducible: 

(b) el polinomio minimal cs igual al polinomio característico. 

Demostrar que ningún subespacio no trivial mvariante por 7 tiene un subespacio com- 
plementario mvariante por 7. 


IS. Sr Fes un operador hncal diagonalizable. entonces cada subespacio mvariante por / 
tene un subespacio complementario invariante por 7. 


19. Sea T un operador lincal sobre el espacio 5" de dimensión finta. Demostrar que / 
tiene un vector cíclico si. y solo sí. es cierto lo siguiente: cada operador Imcal E que conmu 
ta con T es un polinomio en 7. 


20. Sca lun espacio vectorial de dimensión finita sobre el cuerpo E y sea / un operado: 
lincal en 5. Se pregunta cuándo se verifica que cada vector no nulo de E es un vector ct 
clico para 7. Demostrar que este es el easo st. y solo st el polmomie caracteristica pira 
Tes irreducible sobre F. 


21. Sea A una matriz n x n con elementos redes Sea f el operador lineal sobre R” te 
presentado por A cn la base ordenada canónica y sea € el operador imeal sobre U” repre 
sentado por A en la base ordenada canónica. Usar el resultado del Ejerencio 20 para de 
mostrar lo siguiente: si los únicos subespacios Mvartantes por J son Ra el subespacio 
cero. entonces € es diagonalizablo. 
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7.3. La forma de Jordan 


Supóngase que N es un operador lineal nilpotente en el espacio V de di- 
mensión finita. Se considera la descomposición ciclica para N que se obtiene 
del Teorema 3. Se tiene un entero positivo r y r vectores no negativos X,,..., a, en 


V con N-anuladores p,. ... , p,, tales que 
V =Z(a;N)O :-: O Z(ar; N) 
y Pi, divide a p, para 1 = 1,...,r-— 1. Como N es nilpotente, el polinomio 


minimal es x* para algún k < n. Así, todo p, es de la forma p, = x* y la condición 
de divisibilidad simplemente dice que 


ki 2 k2 2 +++ 2 ko. 


Por supuesto, k, = k y k, > 1. La matriz asociada de 1% es la matriz k, x k;. 


00 --- 00 
10 --- 0.0 
(7-24) A;=|0 1 O O? 
900.10 


Asi. el Teorema 3 da una base ordenada para V, en la cual la matriz de N es 
suma directa de matrices elementales nilpotentes (7-24), cuyas dimensiones 
decrecen cuando ¡ crece. Por lo que se ve que, asociados con una matriz nilpo- 
tente n x n, hay un entero positivo r y r enteros positivos k,, ..., k,, de modo 
que k, +:::+k,=nm y k; > k;,,,, y estos enteros positivos determinan la 
forma racional de la matriz, es decir, determinan la matriz, salvo semejanza. 

He aquí un punto que deseamos destacar respecto al operador nilpotente. 
El entero posttivo r es justamente la nulidad de N; en efecto, el espacio nulo 
tiene como base los r vectores 


(1-25) Nti=1a,. 
Si x ustá en el espacio nulo de N, se puede escribir a en la forma 
a= fa +: +$0 


donde f, es un polinomio, cuyo grado se puede suponer menor que k,. Como 
Na = (), para todo í tenemos 


0 = N(f:a0:) 
= Nf. (Ma; 
= (xf Jas. 
Asi. xf, es divisible por x%, y como grd (f;) - k,. ello quiere decir que 
f= enel 


donde «, es cierto escalar. Pero entonces 


a = cr(a*—1a,) + --- + Crla*= 1a,) 
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que muestra que los vectores (7-25) forman una base para el espacio nulo de N. 
I:l lector puede observar que este hecho es también claro desde el punto de 
vista matricial. 

Lo que se desea hacer ahora es combinar lo establecido para operadores 
o matrices nilpotentes con el teorema de descomposición prima del Capítulo 6. 
La situación es la siguiente: supóngase que T es un operador lineal sobre )' y 
que el polinomio característico de T' se puede factorizar sobre F' como sigue 


f= (2 — 0)% --- (7 — ca) 
donde los c,, ..., e, son elementos distintos de F y d; > 1. Entonces el poli- 
nomio minimal de T será 

p= (5 — c1)" --- (1 — cx)” 


donde 1 < r; < d,. Si W, es el espacio nulo de (7 — c,[)Y*, entonces el teorema 
de descomposición prima dice que 


V=W.00-:-OQ0W: 


y que el operador 7; inducido en W, por T tiene polinomio minimal (x — c;,)". 
Sca N, el operador lineal en W, definido por N; = T; — c;¡I. Entonces N, es nil- 
potente y tiene un polinomio minimal x”. En W,, T actúa como N, más el es- 
calar c, veces el operador identidad. Supóngase que elegimos una base del sub- 
espacio W, que corresponda a la descomposición cíclica del operador nilpo- 
tente N,. Entonces la matriz de 7; en esa base ordenada será la suma directa 
de matrices 


c 0 0.0 

l c 00 

(7-26) Pos eo: 
C 

00 -<- lc 


cada cual con c = c,. Además, las dimensiones de estas matrices decrecerán 
al ir de izquierda a derecha. Una matriz de la forma (7-26) se llama una matriz 
elemental de Jordan con valor propio c. Ahora, si se consideran en conjunto 
todas las bases para W,, se obtiene una base ordenada de V. Se describirá la 
matriz A de T en esta base ordenada. 

La matriz A es la suma directa 


Aj 0 +---+ 0 
(7-27) a=|9 to 2 
0 0 --- As 
de matrices A,, ..., Ax. Toda A, es de la forma 
JP 0 0 
a= o oc" 0 
0 0 JE 
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donde cada J('? es la matriz elementa! de Jordan con valor propio c,. También 
en cada A; la dimensión de las matrices J[*? decrece cuando j crece. Se dirá que 
una matriz n x n, A, que satisface todas las condiciones descritas hasta ahora 
(para escalares distintos c,, ..., c,) está en forma de Jordan. 

Hemos observado que si 7 es un operador lineal cuyo polinomio caracte- 
rístico se puede factorizar completamente sobre el cuerpo escalar, entonces 
existe una base ordenada de V, en la cual 7 está en forma de Jordan. Deseamos 
mostrar ahora que esta matriz es algo univocamente asociado con 7T', salvo 
el orden en que se escriben los valores propios de T. Es decir, si dos matrices 
están en forma de Jordan y son semejantes, entonces difieren solo en la orde- 
nación de los escalares c,. 

La unicidad se ve como sigue. Supóngase que existe una base ordenada 
de V en la cual 7' está representado por la matriz de Jordan A, descrita ante- 
riormente. Si A, es una matriz d, X dl, entonces d, es claramente la multiplicidad 
de c; como raíz de polinomio característico de A o de 7. En otras palabras, 
el polinomio característico de T es 


f= (2 —0J% -+- (12 — caja. 


Esto demuestra que Cy, ..., Cx y d,, ..-, d, son únicos, salvo el orden en que 
se escriben. El que A sea la suma directa de las matrices A;, nos da una descom- 
posición en suma directa V = W, O ::: O W, invariante por 7. Obsérvese 
ahora que W, debe ser el espacio nulo de (7 — c¿IY", donde n = dim V; en efec- 
to, A; — c¡f es evidentemente nilpotente y 4, — c,Í es no singular para j 4 i. 
Así vemos que los subespacios W, son únicos. Si 7; es el operador inducido 
en W, por 7, entonces la matriz A, está univocamente determinada como la 
forma racional de (7; — c;f). 

Queremos ahora hacer algunas observaciones más respecto al operador T' y 
la matriz de Jordan A que representa a 7 en una base ordenada. Ellas son: 


(1) Cada elemento de A, que no esté en la diagonal principal o inmediata- 
mente debajo de ésta es O. En la diagonal de A están los k valores propios dis- 
tintos C,, .... C, de 7. También c, está repetido d, veces, donde d, es la multi- 
plicidad de c; como raíz del polinomio característico, es decir, d, = dim W,. 

(2) Para todo i, la matriz A, es la suma directa de n, matrices elementales 
de Jordan J('? con valor propio c;. El número n, es precisamente la dimensión 
del espacio de vectores propios asociados al valor propio c;. En efecto, n, es 
el número de bloques elementales nilpotentes en la forma racional de (7; — c,f), 
y es así igual a la dimensión del espacio nulo de (7 — c;f). En particular, ob- 
sérvese que T es diagonalizable si, y solo si, n; = d, para todo i. 

(3) Para todo ¡ el primer bloque JP” en la matriz A, es una matriz r, X r,, 
donde r, es la multiplicidad de c, como raíz del polino:mio minimal de T. Esto 
se desprende de que el polinomio minimal del operador nilpotente (7; — c;f[) 


r; 


es Xx". 


Por supuesto, como de costumbre, se tienen resultados semejantes para las 
matrices. S1 B es una matriz n x n sobre el cuerpo F y si el polinomio caracte- 
rístico de B se factoriza completamente sobre F, entonces B es semejante sobre 
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Fa una matriz 2 x< on, A, €n la forma de Jordan. y 4 cs única salvo el orden de 
los valores proptos. Se dice que A cs la forma de Jordan de B. 

Obscrvese también que si F es un cuerpo algebraicamente cerrado, enton- 
ces las acotaciones anteriores son válidas para todo operador lincal sobre un 
espacio vectorial de dimensión finita sobre F, o para toda matriz n x n sobre F. 
Asi, por ejemplo, toda matriz n x n sobre el cuerpo de los números complejos 
es semejante a una matriz, esencialmente única. en forma de Jordan. 


Ejemplo 5. Supóngase que T es un operador lineal sobre C'?. El polinomio 
característico para T es (x — c¡Mx — c,), si los números complejos c,, c, son 
distintos, o (x — c,)?. En el primer caso T es diagonalizable y está representado 
en una base ordenada por 

ca 0 
0 co) 


En el segundo caso el polinomio minimal de T' puede ser (x — c), y entonces 
T = cl, o puede ser (x — cy, en cuyo caso T está representado en una base 
ordenada por la matriz 
|: 0 
1 el 


Así toda matriz 2 x 2 sobre el cuerpo de los complejos es semejante a una ma- 
triz de alguno de los dos tipos anteriores, posiblemente con c, = C). 


Ejemplo 6. Sea 4 una matriz compleja 3 x 3: 


2 0 0 
A =la 2 O l- 
b c —1 


El polinomio característico de A es evidentemente (x — 2)(x + 1). O este es 
el polinomio minimal, en cuyo caso Á es semejante a 


2 0 0 
1 2 0 
0.0 -—1 


o el polinomio minimal es (x — 2Xx + 1), en cuyo caso A es semejante a 


2 0 0 
0 2 0O| 
Ahora OO —1 
0.00 
(A -2D(4A+ 5D) =|3a 0 O 
ac 0 O 


y asi A es semejante a una matriz diagonal si, y solo si, « = 0. 
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Ejemplo 7. Sea 


A = 


OO == Nn 
ooo 
a No: 
¡Na a, 


El polinomio característico de A es (x — 2)?. Como A es suma directa de dos 
matrices 2 x 2, es claro que el polinomio minimal de A es (x — 2). Ahora 
sta=00si a = 1, entonces la matriz A está en forma de Jordan. Obsérvese 
que las dos matrices que se obtienen para a = 0 y a = 1 tienen el mismo po- 
linomio característico, pero no son semejantes. Y no lo son porque para la 
primera matriz el espacio solución de (4: — 21) tiene dimensión 3, mientras 
que para la segunda matriz tiene dimensión 2. 


Ejemplo 8 Las ecuaciones diferenciales lineales con coeficientes cons- 
tantes (Ejemplo 14, Capítulo 6) dan una bonita ilustración de la forma de Jordan. 
Sean do. .. - , 4,-, Números complejos y sea V el espacio de todas las funciones 
n veces derivables en un intervalo del eje real que satisfacen la ecuación dife- 
rencial 

d”f 


ar” 


n—1 d 
A a af 0. 
XL 


+a dx 





Sea D el operador derivación. Entonces V es invariante por D, ya que V es el 
espacio nulo de p(D), donde 


p=21"+-*- +01 +40. 


¿Cuál es la forma de Jordan para el operador derivación sobre Y? 
Sean Cy, ..., Cx las raíces complejas distintas de p: 


p= (12 — a) --- (x — c;)”. 


Sea Y, el espacio nulo de (D — ce,fY*, esto es, el conjunto de las soluciones de 
la ecuación diferencial 


(D — cil sf = 0. 


Entonces, como se observó en el Ejemplo 15, Capitulo 6, el teorema de des- 
composición prima dice que 


V=V0-:: OY. 


Sea N, la restricción de D — c¡l a V,;. La forma de Jordan para el operador D 
(en V) está entonces determinada por las formas racionales de los operadores 
nilpotentes N,, ..., N, en los espacios Y,, ..., Vi. 

Así, lo que se debe conocer (para los distintos valores de c) es la forma ra- 
cional del operador N = (D — cl) en el espacio V., que consta de las solucio- 
nes de la ecuación 


(D — clyrf = 0. 
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¿Cuántos bloques elementales nilpotentes habrá en la forma racional para N? 
Su número será la nulidad de N; es decir, la dimensión del espacio propio aso- 
clado al valor propio e. Esa dimensión es Í, pues cualquier función que satis- 
Face la ecuación diferencial 


Df =<f 


cs un múltiplo escalar de la función exponencial h(x) = e”. Por tanto, el ope- 
rador N (sobre el espacio V,) tiene un vector cíclico. Una buena elección para 
un vector cíclico es g = "7 ?h: 

g(x) = qroigcz 
l'sto da 


Ng = (r — 1)a"h 


Nr79 = (+ — 1)'h 


Lo visto en el párrafo anterior muestra que la forma de Jordan para D (en 
el espacio V) es suma directa de k matrices elementales de Jordan, una por cada 
raiz €). 


Ejercicios 
I. Scan ÑN, y N, matrices 3 x 3 nilpotentes sobre el cuerpo F. Demostrar que ÑN, y N, 
son semejantes si, y solo si, tienen el mismo polinomio minimal. 


2. Usar cl resultado del Ejercicio l y la forma de Jordan para demostrar lo siguiente. Sean 
4 y B matrices n x n sobre el cuerpo F que tienen el mismo polinomio característico 


f = (7 — cy4 --- (z — Cy)? 


y cl mismo polinomio minimal. Si ningún d, es mayor que 3, entonces A y B son semejantes. 


3. Si 4 €s una matriz compleja $ x 5 con polinomio característico 
S=(2— 2%a +7) 


y polinomio minimal p = (x — 2)(x + 7), ¿cuál es la forma de Jordan para A? 


4. ¿Cuántas posibles formas de Jordan hay para una matriz compleja 6 x 6 de polino- 
mio característico (x + 2)Y(x — 1)?? 


5. El operador derivación sobre el espacio de los polinomios de grado menor o igual a 3 
está representado en la base ordenada «natural» por la matriz 


ocoso 
ooo 
SONO 
O WOo0SoS 


¿Cuál es la forma de Jordan para esta matriz? (F' un subespacio de los números complejos.) 


6. Sea A la matriz compleja 
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s» 


0 


o - Oo — 
O - - ON S= 
O -=-ONnNOoS:=S 
O - NOS S= 
= NOOOS 
oo:Ss 


Hallar la forma de Jordan para A. 
7. Si A cs una matriz n x n sobre el cuerpo F con polinomio característico 
f = (2 — cyt --- (1 — c1)ó 
¿cuál es la traza de 4? 
8. Clasificar, por semejanza, todas las matrices complejas 3 x 3, 4, tales que 4? = 1. 
9. Clasificar, por semejanza, todas las matrices complejas n x n, A, tales que 4” = [. 


10. Sea n un entero positivo, n > 2, y sea N una matriz n x n sobre el cuerpo F tal que 
N” =0, pero N”"* 4 O. Demostrar que N no tiene raíz cuadrada; es decir, que no existe 
una matriz n x n, A, tal que 4? = N. 


11. Sean N, y N, matrices nilpotentes 6 x 6 sobre el cuerpo F. Supóngase que N, y N, 
tienen el mismo polinomio minimal y la misma nulidad. Demostrar que N, y N, son se- 
mejantes. Demostrar que esto no es cierto para matrices nilpotentes 7 x 7. 


12. Usar el resultado del Ejercicio 11 y de la forma de Jordan para demostrar lo siguiente. 
Sean A y B matrices n x n sobre el cuerpo F que tienen el mismo polinomio característico 


f= (2— 0)% --- (x — cu 


y el mismo polinomio minimal. Supóngase que también para todo i los espacios solución 
de (A — c;f) y (B — c;I) tienen la misma dimensión. Si ningún d, es mayor que 6. entonces 
A y B son semejantes. 


13. Si N es una matriz nilpotente k x k elemental, es decir, N* = 0, pero N*”' 4 0, 
demostrar que N' es semejante a N. Usar entonces la forma de Jordan para demostrar que 
toda matriz compleja n x n es semejante a su transpuesta. 


14. ¿Cuál es el error en la siguiente demostración? Si A es una matriz compleja n x n 
tal que 4* = — A, entonces A es 0. (Demostración: Sea J la forma de Jordan de 4. Como 4' = 
— A, entonces J' = —J. Pero J es triangular, con lo que J” = —J implica que todo elemento 
J es cero. Como J = 0 y A es semejante a J, se desprende que A = 0.) (Dar un ejemplo 
de matriz A no nula tal que 4' = — A.) 


15. Si N es una matriz nilpotente 3 x 3 sobre C, demostrar que A = 1 + ¿N — ¿N? 
satisface a A? = I + N, es decir, que A es la raíz cuadrada de [ + N. Usar la serie binómica 
de (1 + 1)'? para obtener una fórmula parecida para una raíz cuadrada de / + N, donde 
ÑN es una matriz nilpotente n x n sobre C. 


16. Usar el resultado del Ejercicio 15 para demostrar que si c es un número complejo no 
nulo y N es una matriz compleja nilpotente, entonces (cf + N) tiene una raíz cuadrada. 
En seguida usar la forma de Jordan para demostrar que toda matriz compleja rn x n. no 
singular, tiene una raíz cuadrada. 
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7.4. Cálculo de factores invariantes 


Supóngase que A es una matriz n x n con clementos en el cuerpo F. Se 
desea encontrar un método para calcular los factores invariantes Pp,, ..., P, 
que definen la forma racional para A. Se comienza con el caso sencillo en que A 
es la matriz adjunta (7.2) de un polinomio mónico 


p = 1% + Crit? + --- + CT + Co. 


En la Sección 7.1 se vio que p es tanto el polinomio minimal como el polinomio 
característico para la matriz adjunta A. Ahora queremos hacer un cálculo di- 
recto que muestre que p es el polinomio característico para A. En este caso 


z 0.0 --. 0 Co 


—1 x O --- 0 C1 
das LT 

0 0 O ---. T Cn-—2 

0 00 +++ —1 z+Cm 


Se suma x veces la fila n a la fila (1 — 1), con lo que se quita x del lugar 
(n — 1, n — 1) sin cambiar el valor del determinante. Después se suma x veces 
la nueva fila n — 1 a la fila n — 2. Se continúa sucesivamente este proceso hasta 
que todas las x de la diagonal principal hayan desaparecido. El resultado es 
la matriz 


0 0 0 . O 22+-:--+ar+<c 

-—1 0 0 0 i++ aor+<c 
O —1 0 O x2+ --.. + 0x+.<> 
0 00 -.. 0 a? + CL + Cro 
0 00 -++ —1 z + Cn 


que tiene el mismo determinante que x/ — A. El elemento de la parte superior 
derecha de esta matriz es el polinomio p. Se puede simplificar la última columna 
sumando a ella múltiplos de las otras columnas: 


0 00 0 p 
1. 00 0 0 
0-10 0.0 
0 00 0.0 
0 00 -** -10 


Se multiplica cada una de las primeras (n — 1) columnas por —1 y se efectúan 
entonces (1 -- H intercambios de columnas adyacentes con el objeto de llevar 
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la columna 2 a la primera posición. El efecto total de ios 2n — 2 cambios de 
signos deja inalterado el valor del determinante. Se obtiene la matriz 


pOo0 --- 0 
010 ---0 
(7-28) 001 --- Ol 
000 -.. 1 


Ls entonces claro que p = det (x/ — A). 

Vamos a mostrar que, para toda matriz 4» x n, A, hay una sucesión de ope- 
raciones de filas y columnas que transforman x7 — A en una matriz como (7-28), 
en la que los factores invariantes de A aparecen en la diagonal principal. Se 
explicarán completamente las operaciones que se deben utilizar. 

Se operará en F[x]”*”, colección de las matrices n x n con elementos que 
son polinomios sobre el cuerpo F. Si M es una de tales matrices, una operación 
elemental de fila sobre M es alguna de las siguientes: 


1. Multiplicación de una fila de M por un escalar no nulo de F. 

2. Remplazo de la r-ésima fila por la suma de la fila r más f veces la fila s, 
donde f es cualquier polinomio sobre F y rH s. 

3. Intercambio de dos fiias de M. 


La operación inversa de una operación elemental de fila es una operación 
elemental de fila del mismo tipo. Obsérvese que no se puede hacer una afirma- 
ción tal si en (1) se permiten polinomios no escalares. Una matriz elemental 
m x m., esto es, una matriz elemental de F[x]"*" es aquella que se puede ob- 
tener de la matriz unidad m x m por medio de una operación elemental de 
fila simple. Es evidente que cada operación elemental de fila sobre M puede 
efectuarse multiplicando M a la izquierda por una matriz elemental m x m 
apropiada; en efecto, si e es la operación, entonces 


e(M) = ADM. 


Sean M, N matrices de F[x]"*"”. Se dice que N es equivalente por filas a M si 
N puede obtenerse a partir de M por una sucesión finita de operaciones elemen- 
tales de fila: 


M = M>Mi>:>M;i=»N. 


Evidentemente, N es equivalente por filas a M si, y solo si, M es equivalente 
por filas a N, razón por la cual se usará la terminología «M y N son equivalentes 
por filas». Si N es equivalente por filas a M, entonces 


N = PM 
donde la matriz m x m, P, es un producto de matrices elementales: 
P =E,:+* Ez. 
En particular, P es una matriz inversible, con inversa 
PA = Ej? --- Ej?. 
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Claro que la inversa de £), proviene de la operación clemental de fila inversa. 

Fodo esto es precisanente como en el caso de las matrices con clementos 
en F. Se obtienen resultados elementales paralelos a los del Capitulo 1. Por 
tanto, cl siguiente problema que se plantea es introducir una forma escalón 
reducida por filas para matrices polinomiales. Aquí se presenta un nuevo obs- 
táculo. ¿Cómo se reduce por filas una matriz? La primera etapa €s atslar el 
primer elemento de la fila 1 y dividir cada elemento de la fila 1 por ese clemento. 
I:llo no se puede hacer (necesariamente) cuando la matriz tiene elementos poli- 
nomios. Como se verá en el siguiente teorema, se puede soslayar esta dificultad 
en algunos casos; sin embargo, no existe una forma reducida por filas comple- 
tamente apropiada para la matriz general de F[x]"*". Si se introducen también 
operaciones de columna y se estudia el tipo de equivalencia que resulta de permi- 
tir el uso de ambos tipos de operaciones, se puede obtener una forma canónica 
muy útil para toda matriz. El instrumento básico es el siguiente. 


Lema. Sea M una matriz de F|x]"*" que tiene algunos elementos no nulos 
en su primera columna, y sea p el máximo común divisor de los elementos de lu 
columna | de M. Entonces M es equivalente por filas a la matriz N que tiene 


P 
0 


0 
como primera columna. 


Demostración. Demostraremos algo más de lo que se ha enunciado. Mos- 
traremos que existe un algoritmo para encontrar N, es decir, una receta que 
una máquina calculadora podría utilizar para calcular N en un número finito 
de etapas. Ante todo, se necesita cierta notación. 

Sea M una matriz m x n con elementos en F[x] que tiene una primera 
columna no nula 


Íi 
M, =|: 
Fan 
Se define 
(7-29) I(M,) = min grd f, 
SE+O 


p(M,) = M.cd. (fi. --- > fm). 


Sea j un índice tal que grd f, = ((M,). Para precisar, sea ¡ el menor índice 
¡ para el que grd f, = ((M,). Para dividir cada f, por f; se hace 


(7-30) f=f82, + Yo r¡=0 o  grdr;< grd f,. 


Para cada i diferente de j, se remplaza la fila ¿ de M por la fila ¿ menos g, veces 
la fila f. Se multiplica la fila ¿ por el inverso del coeficiente dominante de f,, y 
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entonces se intercambian las filas f y 1. El resultado de estas operaciones es una 
matriz Af” que tiene como primera columna 


J; 


Y2 


(7-31) M=|*%1| 


f1 


Pi 
Fm 


Nx . . , . s > os 
donde f; es el polinomio mónico que se obtiene por normalización de f; para 
que tenga coeficiente dominante 1. Hemos dado un procedimiento bien de- 
tinido para asociar a cada matriz M una matriz M' con las siguientes propie- 
dades: 


(a) M” es equivalente por filas a M. 
(b) p(M;) = p(M,). 
(Cc) O, _.M¡) < UM) o 

p(Mi) 


Mm =| 2 

0 
Es fácil comprobar (b) y (c) de (7-30) y (7-31). La propiedad (c) es justa- 
mente otro modo de establecer que, o existe un ¡ tal que r, + 0 y grd r, < grd f,, 
o bien r;= 0 para todo í y f; es (por tanto) el máximo común divisor de 

his Fm 

La demostración del lema es ahora muy simple. Se comienza con la matriz 
Af aplicándole el procedimiento anterior para obtener M'. La propiedad (c) 
dice que M' servirá como la matriz N en el lema, o, (M,) < (M,). En el último 
caso se aplica el procedimiento a M' para obtener la matriz MY = (M'y. 


Si A no es el N conveniente, se forma MY! = (MY Y y así sucesivamente. 
ll caso es que las desigualdades estrictas 


UM) > UMD) > UMP) > --- 
ho pueden seguir mucho. Después de no más que ((M, ) iteraciones de este pro- 


cedimiento, se debe llegar a una matriz MY que tiene las propiedades que se 
buscan. | 


Teorema 6. Sea P una matriz m x m con elementos en el álgebra de poli- 
nomios F[x]. Las siguientes afirmaciones son equivalentes: 


(1) P es inversible. 
(11) El determinante de P es un polinomio escalar no nulo. 
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(m) P es equivalente por filas a la matriz unidad m xo om. 
(iv) P es un producto de matrices elementales. 


Demostración. Ciertamente (1) implica (11), ya que la función determi- 
nante es multiplicativa y los únicos polinomios inversibles de F[ x] son los pe- 
linomios escalares no nulos. En realidad, en el Capítulo 5 se usó el adjunto 
para hacer ver que (1) y (11) son equivalentes. Este razonamiento da una de- 
mostración diferente de que (i) se desprende de (11). Se completará el ciclo 


(1) = (il) 


(1v) € (ill). 
La única implicación que no es obvia es que (111) se desprende de (11). 
Supóngase (i1) y considérese la primera columna de P. Ella contiene cier- 
tos polinomios Pi, ..., Pm» Y 


Mic.d. (Pi, ..., Pm) = Í 


ya que cada común divisor de p,,..., P, debe dividir (al escalar) det P. Apli- 
cando el lema anterior a P se tiene la matriz 


pl ld => Am 

(7-32) e=|' 

: B 

0 
que es equivalente por filas a P. Una operación elemental de fila altera el de- 
terminante de una matriz por (a lo más) un factor escalar no nulo. Así, det O 
es un polinomio escalar no nulo. Evidentemente, la matriz (m — 1) x (m — 1), B, 
en (7-32) tiene el mismo determinante que O. Por tanto, se aplica el lema ante- 


rior a B. Si se continúa de esta manera por m etapas, se obtiene la matriz trian- 
gular superior 


] da -*- Om | 
R = o : ... dm 
0.0 +. 1 


que es equivalente por filas a R. Obviamente, R es equivalente por filas a la 
matriz unidad m x m. ] 


Corolario. Sean M y N matrices m x n con elementos en el álgebra de po- 
linomios F[x)]. Entonces N es equivalente por filas a M si, y solo si, 
N= PM 
donde P es una matriz inversible m x sm con elementos en Fx]. 
Definimos ahora operaciones elementales de columna y equivalencia por 


columnas de un modo análogo a las operaciones de fila y equivalencia por filas. 
No se necesitan nuevos tipos de matrices elementales, ya que la clase de matri- 
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veo que se puede obtener al hacer una operación clemenial por columna en la 
matriz unidad es la misma que la clase obtenida al usar una sola operación 
lcmental por fila. 


Delinición. La rratriz ÑN es equivalente au la matriz M si se puede pasar de 
Wo N por medio de una sucesión de operaciones 


M=M>M;¡—>:::>M,=N 
coda uma de las cuales es una operación elemental de fila o una operación elemental 


de columna. 


leorema 7. Sean M y N matrices m x n con elementos en el álgebra de 
polmenios Fíx]. Entonces ÑN es equivatente a M si, y solo si, 


N = PMQO 
donde P es una matriz inversible de F[x]"*" y O es una matriz inversible de 


apo. 


Icorema 8. Sea A una matriz n x n con elementos en el cuerpo F y sean 
Mi Py los factores invariantes de A. La matriz xI — A es equivalente a la 
mutriz diagonal n x n cuyos elementos en la diagonal son p,,...,P,, 1,1, ..., 1. 


Demostración. Existe una matriz inversible n x n, P, con elementos en 
F tal que PAP"! está en la forma racional, esto es, tiene la forma bloque 


| 4 0 --- 0 
0 


papa=|9 2: A 0 
0.0 -- 4 


donde 4, es la matriz asociada al polinomio p;,. De acuerdo con el Teorema 7, 
ha mutriz 


(783) P(xI — A)P = x1 — PAP- 


e» equivalente a x/ — A. Ahora 


xl — A 0 ... 0 


(134) — aT— PAP" = 0 al — Az => 0 


0 0 o al—A, 


dende los varios 7 representan Jas distintas matrices unidad de dimensión apro- 


prada. Al comienzo de esta sección se discutió que xf — A, es equivalente a 
ha matriz 


e. 


0 
0 


SO.» O'” 
O +... hum O 
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De (7-33) y (7-34) es claro que 1/ — 4 es equivalente a una matriz diagonal 
que tiene los polinomios p, y (a — r) unos en la diagonal principal. Por una 
sucesión de intercambios de filas y columnas se pueden ordenar los clementos 
de aquella diagonal en el orden que se desee; por ejemplo, p¡,. ...Ppy.1....,1. |] 


El Teorema 8 no da un medio eficaz para calcular los divisorcs elementales 
Pi --., Pp, ya que la demostración depende del teorema de descomposición 
cíclica. Daremos ahora un algoritmo explícito para reducir una matriz de poli- 
nomios a forma diagonal. El Teorema 8 sugiere que se pueden disponer también 
esos elementos sucesivos en la diagonal principal de modo que uno divida al otro. 


Definición. Sea N una matriz de F| xJ"*". Se dice que N está en la forma 
normal (de Smith) si 


(a) todo elemento fuera de la diagonal principal de N es 0; 
(b) en la diagonal principal de N aparecen (en orden) los polinomios f,, ...., f 
de modo tal que f, divide € fu+i, 1<E<Kk<I!— 1. 


En la definición el número / es / = min (mm, n). Los elementos de la diagonal 
principal son f. = Nu» k=1,...,L 


Teorema 9. Sea M una matriz m x n con elementos en el álgebra de po- 
linomios F|x)]. Entonces M es equivalente a una matriz N que está en la forma 
normal. 


Demostración. Si M = 0, no hay nada que demostrar. Sis M %H0 se dará 
un algoritmo para encontrar una matriz M” que sea equivalente a M y que tiene 
la forma 


fi 0 --- 0 
, 0 
(7-35) M' = : R 
0 


donde R es una matriz (m — 1) x (n — 1) y f, divide cada elemento de R. 
Con ello se habrá terminado la demostración, ya que se puede aplicar el mismo 
procedimiento a R para obtener f,, etc. 

Sea (M) el mínimo de los grados de los elementos no nulos de M. Hállese 
la primera columna que contenga un elemento de grado 1(M) e intercambiar 
esa columna con la columna 1. Se llamará a la matriz resultante M'%. Descri- 
bimos un procedimiento para hallar una matriz de la forma 


g 0 -»- 0 
0 

(7-36) : Ss 
0 


que es equivalente a M%. Empezamos por aplicar a la matriz MY el proce- 
dimiento del lema anterior al Teorema 6, procedimiento que se llamará PLE. 
Resulta una matriz 
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pa -*-= hb 


(7-37) MW = o : dl 
de 
Si los elementos «a, .. ., b son todos nulos, bien. Si no, se usa el análogo de PL6 


para la primera fila, procedimiento que se llamará PL6'. El resultado es una 
matriz 


q 0 --+» 0 
(7-38) Mo= | 4 ct e 
y 
donde q es el máximo común divisor de p, a, .... b. Para obtener MY puede 


haberse alterado o no la buena forma de la columna 1. Si se ha alterado, se 
aplica PL6 otra vez. Y esto es lo que se busca. En no más de I(M) etapas 


Mo yo yo. qu 


se debe llegar a una matriz M“? que tiene la forma (7-36), ya que en cada etapa 
sucesiva se tiene que (M**D) < (M*). Se designa el proceso que se acaba 
de definir por P7-36: 


P7-36 


MOS MO. 


En (7-36), el polinomio g puede o no dividir cada elemento de $. Si no, hallar 
la primera columna que tiene un elementa que no sea divisible por g y sumar 
tal columna a la columna 1. La primera nueva columna contiene a g y un ele- 
mento gh + r donde r 40 y grd r < grd g. Aplicando el proceso P7-36, el 
resultado será otra matriz de la forma (7-36), donde el grado del correspon- 
diente g ha decrecido. 

Ahora es obvio que en un número finito de etapas se obtendrá (7-35), es 
decir, se llegará a una matriz de la forma (7-36) donde el grado de g no puede 
reducirse más. | 


Queremos hacer ver que la forma normal asociada a una matriz M es única. 
Se vieron dos cosas que dan la clave de cómo los polinomios f,, ...., f, en el 
Teorema 9 están determinados univocamente por M. Primera, las operaciones 
elementales de fila y de columna no cambian el valor del determinante de una 
matriz cuadrada en más que un factor escalar no nulo. Segunda, las operaciones 
elementales de fila y de columna no cambian el máximo común divisor de cada 
elemento de una matriz. 


Definición. Sea M una matriz m x n con elementos en F[x]. Si 1<k < 
min (m, n), se define 9,(M) como el máximo común divisor de los determinantes 
de todas las submatrices k x k de M. 
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Recuérdese que una submatriz A x k de M es aquella que se obtiene su 
primiendo m — k filas y n — k columnas de M. En otras palabras. se eligen 
ciertos k-tuples 


Il =(%,...,1), 1<4<+.::<ó4<m 
J = (Jm) -.- 41), 1<S HH <"":<jS<n 


y se observa la matriz formada por esas filas y columnas de M. Estamos inte- 
resados en los determinantes 


Miño + Ma 
(7-39) Dr.(M) = det |  : $ 
M jr  “*”* Mus 


El polinomio 0,(M) es el máximo común divisor de los polinomios D, ,(M), 
cuando / y J describen todos los posibles k-tuples. 


Teorema 10. Si M y N son matrices m x mn equivalentes, con elementos 
en F|x], entonces 


(7-40) LM) = 9 N). l < k < min (m, n). 


Demostración. Es suficiente demostrar que una sola operación elemental 
de fila e no cambia a 0,. Como le inversa de e es también una operación ele- 
mental de fila, basta con demostrar lo siguiente: Si un polinomio f divide a 
todo D, ¡(M), entonces f divide a D, ¡(e(M)) para todos los k-tuples / y J. 

Como estamos considerando una operación de fila, sean %,, ...., 0, las filas 
de M y usemos la notación 


Dy(Q%,, . . -, 01) = Dr, ¡(M). 


Dados I y J, ¿cuál es la relación entre D, ¡(M) y D, ¡(etM ))? Se consideran los 
tres tipos de operaciones e: 


(2) multiplicación de la fila r por un escalar « no nulo; 
(b) remplazo de la fila r por la fila r más g veces la fila s, r + s; 
(c) intercambio de las filas r y s.r És. 


Se deja a un lado por el momento el tipo (c) y se tratará de los tipos ¿a) y (b) 
que solo cambian la fila r. Si r no es uno de los índices f,, ...., 1h, entonces 


Di J(e(MYM) = D; ¿¡(M). 
Si r está entre los índices ¿,, ..., [,, entonces para los dos casos tenemos 


(a) Dr. ¿(e(U)) = Di(Qi, 2... y CU)... -) 01) 


= cD (as, +... y Orpoo»- >) Oir) 


| 
la) 
O 
vo 
pi 
A 

X 
Na? 


ll 


Dy(Qi, “+ » y Ar + YAs, - --> 041) 
= Dr,s(M) + gDyi(a;, ....y Oso...) 01). 


(b) Dr, set) 
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Para las operaciones del tipo (a) es claro que cualquier f que divide a D, ¡(M) 
también divide a D, J(e(M)). Para el caso de la operación del tipo (b) obsér- 
vese que 


Dj(0a)--.1%)...1%) =0, — sis = i, para algún j 
DilQiy-+-,%y+--, 0%) = ED y(M), sis + ij para todo y. 


La T' en la última ecuación es el k-tuple (¿,, ..,s,..., f¿) ordenado en orden 
creciente. Ahora es evidente que, si f divide cada D, ¡(M), entonces f divide 
a cada D, ¡(e(M )). 

Las operaciones del tipo (c) pueden tratarse más o menos por el mismo 
razonamiento dado, O usando el hecho de que tal operación puede ser efec- 
tuada por una sucesión de operaciones de los tipos (a) y (b). | 


Corolario. Toda matriz M de F[x)"*" es equivalente precisamente a una 


matriz N que está en forma normal. Los polinomios f,, ..., f;,, que aparecen 
en la diagonal principal de N son 
fo = HAM l < k < min (m, n) 


MY 
donde, por conveniencia, se define Ó0(M) = 1. 


Demostración. Si N está en forma normal con elementos en la diagonal 
fi -.., jj es muy fácil ver que 


AN) = fifa --- fu 


Por supuesto que la matriz N en este último corolario se Hama la forma 
normal de M. Los polinomios f,, ..., f, son llamados a menudo los factores 
invariantes de M. 

Supóngase que Á es una matriz n x n con elementos en F, y sean p,, ...., P, 
los factores invariantes de A. Se ve ahora que la forma normal de la matriz 
x/ — A tiene en la diagonal los elementos 1, 1, ..., 1, p,, ..., p,. El último 
corolario dice qué son p;, ..., p,. en términos de las submatrices de xf/ — A. 
El número n — r es el mayor k tal que 0,(x7 — A) = 1. El polinomio minimal 
p, €es el polinomio característico de A dividido por el máximo común divisor 
de los determinantes de todas las submatrices (n — 1) x (n — 1) de x] — A, etc. 


Ejercicios 


nxn 


I. ¿Es verdadero o falso que toda matriz de F[x] 
triangular superior? 


es equivalente por filas a una matriz 


2. Sea T un operador lineal sobre un espacio vectorial de dimensión finita y sea A la matriz 
de T en una base ordenada. Entonces T' tiene un vector cíclico si, y solo st, los determinantes 
de las submatrices (n — 1) x (n — 1) de x/ — Á son primos relativos. 


3. Sea A una matriz n x n con elementos en el cuerpo F y sean f,, ..., f, los elementos 
de la diagonal de la forma normal de x/ — A. ¿Para qué matrices A es f, + 1? 


M0 Aeebra lineal 


4. Construr un operador lincal 7 con polinomio minimal x*(x — 1 y polinomio carac- 
teristico va — 1). Describir la descomposición prima del espacio vectorial por 7 y hallar 
las proyecciones sobre los componentes primos. Hallar una base en la cual la matriz de 
FT esté en torma de Jordan. Hallar también una descomposición explícita en suma directa 
del espacio subespacios T-ciclicos, como en el Teorema 3 y dar los factores invariantes. 


5. Sea T el operador lineal sobre R*? representado en la base canónica por la matriz 


O -=» -». OQ == OO > 


O. == O == O O >» 


O -— == -_ OOOÓ qm 


O -=. == == O O O mu 


Oo ooo0o0oo mn 

Ooo0o”OooOo0ooOo == 

Oo rr OO00O0O0O 
| 

O -» -» O — > a > 


(a) Hallar el polinomio característico y los factores invariantes. 

(b) Hallar la descomposición prima de R*? por T y las proyecciones en lus componentes 
primos. Hallar la descomposición ciclica de cada componente primo, como en el Teorema 3. 

(c) Hallar la forma de Jordan de A. 

(d) Hallar una descomposición en suma directa de R? en subespacios T-ciclicos, como 
en el Teorema 3. (Sugerencia: Un modo de hacerlo es usar el resultado en (b) y una apro- 
piada generalización de las ideas estudiadas en el Ejemplo 4.) 


7.5. Resumen: operadores semisimples 


En los dos últimos capítulos nos hemos ocupado de un operador lineal 
simple 7 sobre un espacio vectorial Y de dimensión finita. El programa ha con- 
sistido en descomponer 7 en suma directa de operadores lineales de naturaleza 
elemental, con el objeto de tener información detallada respecto a cómo «opera» 
T sobre el espacio V. Resumimos lo que se ha hecho hasta ahora. 

Comenzamos estudiando 7' por medio de los valores propios y los vectores 
propios. Introdujimos operadores diagonalizables, operadores que pueden ser 
completamente descritos en términos de los valores y vectores propios. Obser- 
vamos entonces que T' podía no tener un vector propio simple. Aun en el caso 
de un cuerpo escalar algebraicamente cerrado, cuando todo operador lineal 
tiene al menos un vector propio, se observó que los vectores propios de T' no 
generaban necesariamente el espacio. 

Se demostró luego el teorema de descomposición cíclica, que expresa cual- 
quier operador lineai como suma directa de operadores con un vector cíclico, 
sin hipótesis alguna acerca del cuerpo escalar. Si U es un operador lineal con 
un vector cíclico, existe una base (%,, .... 0,) con 


Ua;, = Qj41, j=1,...,n—1 
Ua, = —(9Q] — (1 — ***+ — Cp-10pn. 
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lil efecto de U sobre esta base es entonces trasladar cada a, al siguiente vector 
%;+1, COn excepción de que Ugo, es una combinación lineal preestablecida de 
los vectores de la base. Como el operador lineal general 7 es suma directa de 
un número finito de tales operadores U, se obtuvo una descripción explícita 
y razonablemente elemental del efecto de T. 

A continuación se aplicó el teorema de descomposición cíclica a operadores 
nilpotentes. Para el caso de un cuerpo escalar algebraicamente cerrado, se com- 
binó esto con el teorema de descomposición prima para obtener la forma de 
Jordan. La forma de Jordan da una base [a,,..., 0,) del espacio V tal que, 
para todo j, o bien Ta, es un múltiplo escalar de a,, o bien Ta; = ca; + Aj43- 
Tal base describe ciertamente el efecto de T de modo explicito y elemental. 

La importancia de la forma racional (o de la forma de Jordan) proviene 
de que existe, más bien que del hecho que se pueda calcular en casos determi- 
nados. Claro está que si se tiene un operador lineal específico 7 y se puede calcu- 
lar su forma cíclica o de Jordan, es lo que hay que hacer, pues, teniendo +41 
forma, se puede deducir una gran cantidad de información acerca de 7. Dos 
tipos diferentes de dificultades surgen en el cálculo de esas formas canónicas. 
Una es desde luego lo largo de los cálculos. Otra, que puede no haber un mé- 
todo para hacer los cálculos, imcluso si se tienen el tiempo y la paciencia ne- 
cesarios. La segunda dificultad surge, por ejemplo, al tratar de hallar la forma 
de Jordan de una matriz compleja. Sencillamente no hay un método bien de- 
finido para factorizar el polinomio característico, y asi uno queda detenido al 
empezar. La forma racional no presenta esta dificultad. Como se vio en la Sec- 
ción 7.4, hay un método bien definido para hallar la forma racional de una 
matriz n x n dada; con todo, los cálculos son por lo general extremadamente 
largos. 

En el resumen de los resultados de estos dos últimos capítulos no se ha men- 
cionado aún uno de los teoremas que se demostraron. Es el teorema que dice 
que si 7 es un operador lineal sobre un espacio vectorial de dimensión finita 
sobre un cuerpo algebraicamente cerrado, T se expresa univocamente como 
suma de un operador diagonalizable y de un operador nilpotente que conmutan. 
Esto se demostró con el teorema de descomposición prima y con cierta infor- 
mación sobre los operadores diagonalizables. No es éste un teorema tan pro- 
fundo como el de la descomposición cíclica o el de la existencia de la forma 
de Jordan, pero sí tiene aplicaciones importantes y útiles en algunas partes de 
la matemática. Para concluir este capitulo demostraremos un teorema análogo 
sin suponer que el cuerpo escalar es algebraicamente cerrado. Comenzaremos 
definiendo los operadores que desempeñan el papel de los operadores diago- 
nalizables. 


Definición. Sea V un espacio vectorial de dimensión finita sobre el cuerpo 
F y sea T un operador lineal sobre V. Se dice que T es semisimple si todo subespacio 
T-invariante tiene un subespacio complementario T-invariante. 


Lo que se va a demostrar es que, con ciertas restricciones sobre el cuerpo F, 
todo operador lineal 7 se expresa univocamente en la forma T = S + N, don- 


0? Algebra lincal 


de $ es semisimple, N es nilpotente y SN = NS. Primero se han de caracterizar 
los operadores semisimples por medio de sus polinomios: minimales, y esta 
caracterización hará ver que, cuando F es algebraicamente cerrado, un ope- 
rador es semisimple si, y solo si, es diagonalizable. 


Lema. Sea T un operador lineal sobre el espacio vectorial de dimensión 
finita V y sea V= W, O ::: O W, la descomposición prima de T; es dedir, 
si p es el polinomio minimal de T y p = pi - ** pi" es la factorización prima de p, 
entonces W, es el espacio nulo de p((TY“. Sea W el subespacio de V que es inva- 
riante por T. Entonces 


W=(WNW)Je:-:9(WNAW) 


Demostración. Para la demostración se necesita recordar un corolario de 
la demostración del teorema de descomposición prima, en la Sección 6.8. Si 
E,,..., E, son las proyecciones asociadas a la descomposición V = W, GB :::60 
W,, entonces cada E, es un polinomio en 7. Esto es, existen polinomios h,....,A, 
tales que E; = h;(T). 

Sea ahora W el subespacio que es invariante por T. Si a es un vector cual- 


quiera de W, entonces a = 4d, + :-* +, con x, en W;,. Ahora a, = Ea = 
h¡(Dja, y como W es invariante bajo T, cada a, está también en W. Así cada 
vector a de Wes de la forma a = a, + :** + q,.con a,en la intersección W (A W). 
Esta expresión es única, ya que V = W, O -:: O W,. Po; tanto, 


W=(WAaWO--OWNW,). | 


Lema. Sea T un operador lineal sobre V y supóngase que el polinomio mi- 
nimal de T es irreducible sobre el cuerpo escular F. Entonces T es semisimple. 


Demostración. Sea W un subespacio de V invariante por 7. Se debe de- 
mostrar que W tiene un subespacio complementario 7-invariante. De acuerdo 
con el corolario del Teorema 3, será suficiente demostrar que si f es un poli- 
nomio y f es un vector de V tal que f(T)f está en W, entonces existe un vector 
a en W con FP = Ff(Tha. Así, pues, supóngase que fi está en V y que f es un 
polinomio tal que f(7)f está en W. Si f(T)fB = O, se hace x = O y entonce> 2 
es un vector en W con f(D)fB = f(Tha. Si (TI) HF O, el polinomio f no es di- 
visible por el polinomio minimal p del operador 7. Como p es primo, eso quiere 
decir que f y p son primos relativos y existen polinomios g y h tales que fe + 
ph = 1. Como p(T) = U se tiene entonces que f(T)e(T) = [. De esto se sigue 
que el vector fí debe estar en el subespacio W; en efecto, 


B = g«(DITD)E 
= «T1IFDE) 


cuando /(7)f está en W y W es invariante por 7. Se hace x = fi. | 


Teorema 11. Sea T un operador lineal sobre un espacio vectorial de di- 
mensión finita V. Una condición necesaria y suficiente para que T sea semisimple 
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os que el polinomio minimal p de T sea de la forma p = p, : * * Py, donde Py, ...,Pr 
wn polinomios irreducibles distintos sobre el cuerpo escalar F. 


Demostración. Supóngase que T es semisimple. Se demostrará que ningún 
polmomio irreducible está repetido en la factorización prima del polinomio 
mmimal p. Supóngase lo contrario. Entonces existe algún polinomio mónico g, 
no escalar, tal que g? divide a p. Sea W el espacio nulo del operador g(7). Enton- 
ces Mes invariante por 7. Ahora bien, p = g?*h para algún polinomio h. Como 
g no es un polinomio escalar, el operador g(TM(T) mo es el operador cero y 
huy un vector f en Y tal que g(TIM(T)B + 0; es decir, (gh)f + 0. Ahora. (gA)f4 
está cn el subespacio W, ya que g(ghf$) = g?hf = pff = 0. Pero no existe vector 
alguno a en W tal que g4f = ghx; en efecto, si a está en W 


(gh)a = (hgla = h(ga) = h(0) =0. 


Así W no puede tener un subespacio complementario T-invariante, contradi- 
ciendo la hipótesis de que 7' es semisimple. 

Ahora supóngase que la factorización prima de p es p = p, * * * Px, donde 
Pis ---, py son polinomios mónicos (no escalares) irreducibles distintos. Sea 
17 un subespacio de V invariante por 7. Se demostrará que V tiene un subes- 
pucio complementario T-invariante. Sea V = W, O ::: 0 W, la descompo- 
sición prima de T, es decir, sea W, el espacio nulo de p;(T). Sea T; el operador 
lineal inducido en W; por 7, de modo que el polinomio minimal de 7; sea el 
primo p,. Ahora, W (A W, es un subespacio de W, que es invariante por 7; (o 
por 7). Por el último lema existe un subespacio V, de W; tal que W, = 
(WA W;) O V,, y V; es invariante por 7; (y, por tanto, por 7). Entonces tenemos 


V=-W,0---Ov, 
= WANAWJOVO-:HOIMNWJOYV: 
= WONW)+-::+(WNWJOVOÓ--:O/V.. 


Por el primer lema anterior, W = (WN W,)60 ::: 0 (W (1 W,). De modo 
que si W"= V,O:::Q/V,, entonces Y = WO W y W” es invariante 
por T. | 


Corolario. Si T es un operador lineal sobre un espacio vectorial de dimensión 
finita sobre un cuerpo algebraicamente cerrado, T es semisimple si, y solo si, 
T es diagonalizable. 


Demostración. Si el cuerpo de los escalares es algebraicamente cerrado, 
los primos mónicos sobre F son los polinomios x — c. En este caso T' es semi- 
simple si, y solo st, el polinomio minimal de T es p = (x — C,): * * (x — Ch), 
donde los c,, ..., c, son elementos distintos de F. Esto es precisamente el cri- 
terio para que 7 sea diagonalizable, que se estableció en el Capitulo 6. | 


Debemos señalar que 7' es semisimple si, y solo si existe un polinomio f, 
que es producto de factores primos distintos, tal que f(T') = O. Esto es solo 
en apariencia diferente de la condición de que el polinomio mivimal sea un 
producto de factores primos distintos. 


Ut Algebra Ilma! 


Sca ahora expresar un operador lmeal como suma de un operador lincal 
semisimple y de un operador nilpotente que conmutan. Para ello se restringirá 
ci cuerpo de los escalares a un subcuerpo de los números complejos. El lector 
advertido verá que lo importante es que el cuerpo F sea un cuerpo de caracte- 
rística cero, esto es, que para todo entero positivo n, la suma 1 + : ++ + 1 (n veces) 
en F no debe ser 0. Para un polinomio f sobre F, se representa por f% la k-ésima 
derivada formal de f. En otras palabras, fYW = D'*f, donde D es el operador 
derivación sobre el espacio de los polinomios. Si g es otro polinomio, f(g) re- 
presenta el resultado de sustituir g en f;, es decir, el polinomio que se obtiene 
por la aplicación de f al elemento g en el álgebra lineal F[ x]. 


Lema (fórmula de Taylor). Sea F un cuerpo de característica cero y sean 
g y h polinomios sobre F. Si f es cualquier polinomio sobre F con grd f < n, 
entonces 


2) n) 
f A en O q py 


n! 


fl) = FI) + SNE — h) + 


Demostración. Lo que estamos demostrando es una generalización de la 
fórmula de Taylor. El lector probablemente estará familiarizado con el caso 
especial en que h = c, un polinomio escalar, y g = x. En tal caso, la fórmula 
dice que 


f=f0) =/() + (0) (x — c) 
O O o a 


La demostración de la fórmula general es nada más que una aplicación 
del teorema del binomio 


1 
(a + DJ ab habra y ED ar e 0 4 DA 
El lector deberá ver que, como la sustitución y derivación son procesos lineales, 
solo se necesita demostrar la fórmula cuando f= x*. La fórmula para 
n 
f= Y cr se deduce por combinación lineal. En el caso f = x*, con 
k=0 


k < n, la fórmula dice que 


g* — h* + khkg — h) y HE m1 hr g — hy? + ... + (g — h)* 
que no es más que el desarrollo binómico de 


gt = [A+ (9 —h* NM 


Lema. Sea F un subcuerpo de los números complejos, sea f un polinomio 
sobre F y sea f' la derivada de f. Las siguientes afirmaciones son equivalentes: 


(a) f es el producto de polinomios irreducibles distintos sobre F. 
(b) f y f' son primos relativos. 
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(c) Como polinomio de coeficientes complejos, f no tiene raices repetidas. 


Demostración. Demostremos primero que (a) y (b) son afirmaciones equi- 
valentes acerca de f. Supóngase que en la factorización prima de f sobre el 
cuerpo F, algún polinomio primo (no escalar) p esté repetido. Entonces f = p*h 
para algún h en F[x]. Entonces 


f' = pk + 2pp'h 


y p es también un divisor de f”. Luego f y f” no son primos relativos. Conclui- 
mos que (b) implica (a). 

Ahora supóngase que f = p, :**Px, donde P,, ..., Ps son polinomios 
irreducibles no escalares distintos sobre F. Sea f;= f/p;. Entonces 


f = pÍ, + p2af2 + ... + prJz. 


Sea p un polinomio primo que divide a f y a f”. Entonces p = p, para cierto ¿. 
Ahora bien, p, divide a f; para j $ í, y como p, también divide a 


k 

f = PA Pif; 
vemos que p, debe dividir a p;f;. Por tanto, p, divide a f, o a p;. Pero p, no divide 
1 f,, ya Que P¡, ..., Pp, Son distintos. Así p, divide a p;. Esto no es posible, ya 
(que p; tiene grado menor en una unidad que el grado de p;. Concluimos que nin- 
yum primo divide a f ya f”, o que (f, f') = 1. 

Para ver que la afirmación (c) es equivalente a (a) y (b), se necesita solamente 
observar lo siguiente. Supóngase que f y g son polinomios sobre F, un sub- 
vuerpo de los números complejos. Se puede considerar también a f y g como 
polinomios con coeficientes complejos. La afirmación de que f y g son primos 
relativos como polinomios sobre F, es equivalente a la afirmación de que f y £ 
son primos relativos como polinomios sobre el cuerpo de los números com- 
plejos. Se deja la demostración como ejercicio. Se usa este hecho con g = f”. 
()hsérvese que (c) no es más que (a) cuando f es considerado como polinomio 
sobre el cuerpo de los números complejos. Así (b) y (c) son equivalentes por 
vl mismo razonamiento que se dio anteriormente. | 


Podemos ahora demostrar un teorema que hace más evidente la relación 
entre los operadores semisimples y los operadores diagonalizables. 


Teorema 12. Sea F un subcuerpo del cuerpo de los números complejos, 
wa V un espacio vectorial de dimensión finita sobre el cuerpo F y sea T un ope- 
rador lineal sobre V. Sea KB una base ordenada de V y sea A la matriz de T en la 
hase ordenada 03. Entonces T es semisimple si, y solo si. la matriz A es semejante, 
wbhre el cuerpo de los números complejos, a una matriz diagonal. 


Demostración. Sea p el polinomio minimal de 7. Según el Teorema 11l, 
l' cs semisimple si, y solo si, p = p, * * * px, donde los p;,, ..., p, son polino- 
mios Iirreducibles distintos sobre F. Por el último lema se ve que 7 es semisimple 
si, y solo si, p no tiene raíces complejas repetidas. 


200 Alevchra lime! 


Ahora p cs también cl polinomio minimal de la matriz A. Se sabe que A 
es semejante, sobre el cuerpo de los números complejos, a una matriz diagonal 
si, y solo si, su polinomio minimal no tiene raíces complejas repetidas. Esto 
demuestra el teorema. |] 


Teorema 13. Sea F un subcuerpo del cuerpo de los números complejos, 
sea V un espacio vectorial de dimensión finita sobre F y sea T un operador lineal 
sobre V. Existen un operador semisimple S en V y un operador nilpotente N en 
V tal que 


(1) T=S4N; 

(1) SN = NS. 
Además, el S semisimple y el N nilpotente que satisfacen (1) y (11), son únicos y 
cada uno es un polinomio en T. 


Demostración. Sea pi' : +: p'" la factorización prima del polinomio mi- 
nimal de Ty sea f = p, : * * px- Sea r el mayor de los enteros positivos F,,....., Fy- 
Entonces el polinomio f es un producto de factores primos distintos, f” es divi- 
sible por el polinomio minimal de 7. y así 


KTy =0. 


Se construirá una sucesión de polinomios go, £1. £», ... tal que 


es divisible por f”**,n = 0, 1,2, ... Se toma gp = 0 y entonces flx— 2.1%) = 
fix) = fes divisible por f. Supóngase que se han elegido los gy, .. - . 8n- 1- Sea 


n—1 
h=x-— Y gS 
j=0 


de modo que, por suposición, fíf) es divisible por f”. Se quiere elegir g, de 
modo que 


Fh — gnf") 


sea divisible por f”**. Aplicando la fórmula general de Taylor se obtiene 


Fh == 9uÍ") = F(h) — 9uÍ". "(h) + f+b 


donde b es cierto polinomio. Por hipótesis, f(h) = qf”. Asi se ve que para ob- 
tener que f(h — g,f”) sea divisible por f”** se necesita solo elegir g, de tal 
modo que (q — g,f”) sea divisible por f. Esto puede hacerse, ya que f no tiene 
factores primos repetidos, con lo que f y f' son primos relativos. Si a y e son 
polinomios tales que af + ef' = 1 y si se hace g, = eq, entonces q — g,f” es 
divisible por f. 

Se tiene ahora una sucesión go, £i, . - . tal que f”** divide a 


f ( — Y» as). Tomemos n = r — 1, y entonces, como f(TY = 0, 
j=0 
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¡(7 E amar) = 0. 
NE DIO E, AY: 


Como y gif? es divisible por f, se ve que N" = 0 y N es nilpotente. Sea 
j=1 


Ss = T— N, entonces f(S) = F(T — N) = 0. Como f tiene factores primos 
distintos, S es semisimple. 

Ahora se tiene 7 = S + N, donde S es semisimple, N nilpotente y cada 
uno es un polinomio en 7. Para demostrar la unicidad, se pasará del cuerpo 
de los escalares F al cuerpo de los números complejos. Sea U3 una base orde- 
nada del espacio V. Se tiene entonces que 


[Tle = LSle + [Ne 


mientras que [S']g es diagonalizable sobre los números complejos y [N]g es 
nmilpotente. Estas matrices diagonalizables y nilpotentes que conmutan están 
univocamente determinadas, como se vio en el Capítulo 6. | 


ve 


Ejercicios 


J. Si N es un operador nilpotente sobre V, demostrar que para cualquier polinomio f, 
la parte semisimple de f(N) es un múltiplo escalar del operador identidad (F, subcuer- 
po de C). 


2. Sean F un subcuerpo de los números complejos, Y un espacio vectorial de dimensión 
linsta sobre F y TF un operador lineal semisimple sobre Y. Si f es cualquier polinomio sobre 
F, demostrar que f(7') es semisimple. 


3. Sea T un operador lineal sobre un espacio de dimensión finita sobre un subcuerpo 
de €. Demostrar que T' es semisimple si, y solo si, es cierto lo siguiente: si f es un polinomio 
y f(T) es nilpotente, entonces f(7) = O. 


$. Espacios con producto 
interno 


8.1. Productos internos 


A lo largo de este capítulo se considerarán solo espacios vectoriales reales 
o complejos, esto es, espacios vectoriales sobre el cuerpo de los números rea- 
les o el cuerpo de los números complejos. El principal objetivo ahora es el estudio 
de los espacios vectoriales en los que tiene sentido hablar de «longitud» de un 
vector y de «ángulo» entre dos vectores. Se hará esto mediante el estudio de 
cierto tipo de función de valor escalar sobre parejas de vectores, conocido como 
producto interno. Un ejemplo de producto interno es el producto escalar de 
vectores en R?, El producto escalar de los vectores 


a =— (21, L2, 23) y 16) = (ya, Y2, Ys) 
en R? es el número real 


(a18) = 21N + toYa + 234. 


Geométricamente, este producto escalar es el producto de la longitud de a, 
la longitud de f y el coseno del ángulo entre a y f. Es, por tanto, posible de- 
finir los conceptos geométricos de «longitud» y «ángulo» en R*? por la defini- 
ción algebraica de un producto escalar. 

Un producto interno sobre un espacio vectorial es una función con pro- 
piedades similares a las del producto escalar en R?, y en términos de tal producto 
interno se puede también definir «longitud» y «ángulo». El comentario respecto 
a la noción general de ángulo se restringirá al concepto de perpendicularidad 
(u ortogonalidad) de vectores. En esta primera sección se dirá qué es un pro- 
ducto interno, se considerarán unos ejemplos particulares y se establecerán 
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algunas de las propiedades básicas de los productos internos. Entonces se vol- 
veraca la tarea de discutir longitud y ortogonalidad. 


Definición. Sean F el cuerpo de los números reales, o de los complejos, y 
lun espacio vectorial sobre F. Un producto interno sobre V es una función que 
asmena a cada par ordenado de vectores a, B de V un escalar (a|B) de F de tal modo 
que para cualesquiera a, B, y de V y todos los escalares c 


(a) (a + Blr) = (alm) + (Blm; 

(b) (calf) = cl(al8); 

(c) (Bla) = (al8), donde la barra indica conjugación compleja, 
(1d) (ala) > 0 si a F 0. 


Debe observarse que las condiciones (a), (b) y (c) implican que 
(4) (alcé + y) = t(alf8) + (alv). 
(dra observación debe hacerse. Si F es el cuerpo R de los números reales, los 
complejos conjugados que figuran en (c) y (e) están demás; sin embargo, en 


cl caso de los complejos son necesarias para la consistencia de las condiciones. 
Sin estos complejos conjugados se tendría la contradicción: 


(aja) > 0 y  (íalia) == — faja) > O. 


En los ejemplos que siguen y a lo largo del capítulo, F es el cuerpo de los 
números reales o de los números complejos. 


Ejemplo 1. En F” existe un producto interno que se llama producto interno 
canónico. Está definido sobre a = (x,, .... Xx.) y PB = (Y1> ---. Yn) por 


(8-1) (a]8) = Y 2,4; 
J 
Cuando F = R, esto también puede escribirse 


(a]8) = e Tis. 


I'n el caso real, el producto interno canónico es el llamado a menudo producto 
escalar, y se representa por a : f. 


Ejemplo 2. Para a = (x,,x2) y B = (y,, y,) en R?, sea 


(a]6) = iY — Tor — TiYo + 4xoY2. 


Como (ajo) = (x, — xP? + 3x3, se tiene que (aja) > 0 si «a + 0. Las con- 
diciones (a), (b) y (c) de la definición se pueden verificar fácilmente. 


Ejemplo 3. Sean Y = F"*", el espacio de todas las matrices n x n sobre F. 
Entonces Y es isomorfo a F” de un modo natural; se sigue, pues, del Ejem- 
plo 1, que la igualdad 


(A1B) = Z AMB 
j,.k 
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define un producto interno sobre V. Además, si se introduce la matriz trans- 
puesta conjugada B*, donde Bf = B,,. se puede expresar este producto interno 
sobre F"*” en términos de la función traza: 


(A|B) = tr (AB*) = tr (B*4). 
En efecto, 


tr (AB*) = z (ABS; 
j 
= DI AnBrj 
ji k 
= 2 > AjnB. 
J Ok 


Ejemplo 4. Sea F”*? el espacio de las matrices (columnas) n x 1 sobre F, 
y sea O una matriz inversible n x n sobre F. Para X, Y en F"*”' se hace 


(X]Y) = Y*Q*Q0X. 


Se identifica la matriz 1 x 1 del segundo miembro con su solo elemento. Cuan- 
do O es la matriz untdad, este producto interno es esencialmente el mismo del 
Ejemplo 1; se llama el producto interno canónico sobre F"*?., El lector deberá 
observar que la terminología de «producto interno canónico» se usa en dos 
contextos especiales. Para un espacio vectorial general de dimensión finita 
sobre F no hay un producto interno obvio que se pueda llamar canónico. 


Ejemplo 5. Sea Y el espacio vectorial de las funciones continuas de valor 
complejo en el intervalo unitario, O < f < 1. Sea 


(JN = £ OJO dt. 


El lector está probablemente mas familiarizado con el espacio de las funciones 
de valor real en el intervalo unitario, y para este espacio la conjugación com- 
pleja puede omitirse. 


Ejemplo 6 Este es en realidad un conjunto de ejemplos. Por el siguien- 
te método se pueden construir nuevos productos internos a partir de uno dado. 
Sean V y W espacios vectoriales sobre F y supóngase que (| ) es un producto 
interno sobre W. Si T es una transformación lineal no singular de V en W, en- 
tonces la igualdad 


pr(a, B) = (Ta|T8) 


define un producto interno py sobre V. El producto interno del Ejemplo 4 es 
un caso especial de esta situación. También lo son los siguientes: 


(a) Sea V un espacio vectorial de dimensión finita y sea 
GQ = lar, .. . , Anj 


una base ordenada de V. Sean €,, ..., €, los vectores de la base canónica en 
F” y sea T la transformación lineal de Y en F” tal que Ta, =€,j=1,...... 
En otras palabras, sea T el isomorfismo «natural» de V sobre el producto in- 
terno canónico sobre F”, entonces 


A 
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pr(Z 1,0, D yr) = Y 1,8; 
J k j=1 


Ant. para cada base para V existe un producto interno sobre Y con la propiedad 
de que (a,[a,) = 0;,; en efecto, es fácil ver que existe exactamente uno solo 
de tales productos internos. Más adelante se verá que cada producto interno 
sobre Y está determinado por alguna base (3 en la forma anterior. 

(b) Volvamos nuevamente al Ejemplo 5 y tomemos Y = W, el espacio 
de las funciones continuas en el intervalo unitario. Sea T' el operador lineal 
«multiplicación por tf», esto €s, (7fMt) = ¿f(t), O<t1<1. Es fácil ver que 
l' ys limcal. También 7 es no singular; en efecto, supóngase que 7f = 0. Enton- 
cos 1f(1) = 0 para O < 1 < 1; luego f(t) = O para £ > 0. Como f es continua, 
se tiene también que f(0) = 0, o f = 0. Ahora, usando el producto interno 
del Ejemplo 5, se construye un producto interno nuevo sobre Y haciendo 


pr(4,9) = |, INOTDO al 
= [0902 a. 


Se vuelve ahora a las observaciones generales para los productos internos. 
Supóngase que Y es un espacio vectorial complejo con un producto interno. 
Entonces, para todo a, f en V 


(alg) = Re (a[8) + 1 Im (a/8) 


donde Re (x|8) e Im («| 8) son las partes real e imaginaria del número comple- 
jo (a|f8). Si z es un número complejo, entonces Im (z) = Re (— iz). Se sigue que 


Im (a]8) = Re [—¿(a/8)] = Re (0126). 


Así, el producto interno está completamente determinado por su «parte real» 
de acuerdo con 


(8-2) (a]8) = Re (al8) + i Re (a[i8). 


Ocasionalmente es muy útil saber que un producto interno sobre un espacio 
vectorial, real o complejo, está determinado por otra función, la llamada forma 
cuadrática determinada por el producto interno. Para definirla, primero se 
representa la raíz cuadrada positiva de (ala) por |la]|; llo] es la llamada norma 
de a respecto al producto interno. Considerando el producto interno canónico 
en R?, C*, R? y R?, el lector podrá convencerse de que es apropiado pensar 
en la morma de a como la «longitud» o «magnitud» de a. La forma cuadrática 
determinada por el producto interno es la función que asigna a cada vector x 
el escalar |lo/[?. Se sigue de las propiedades del producto interno que 


lla + Bl]? = lla]? + 2 Re (a]8) + ]1811? 


para todos los vectores a y f. Así, en el caso real 





(8-3) (a|8) = z lla + Bl? — 3 lla - Blp. 
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En el caso complejo se usa (8-2) para obtener la expresión más complicada 
1 1 ) . , . 
(84) — (a]8) = ¿lla + ll? — q lle — él? +3 lla + dell? — E lle — dl 


Las igualdades (8-3) y (8-4) son llamadas las identidades de polarización. Obsér- 
vese que (8-4) puede también ser escrita de la siguiente manera: 


1. . 
(a18) = 1,2, * lla + ¿"8]12. 


Las propiedades obtenidas anteriormente son válidas para cualquier pro- 
ducto interno sobre un espacio real o complejo V, independientemente de su 
dimensión. Se vuelve al caso en que V es de dimensión finita. Como es de pen- 
sarlo, un producto interno en un espacio de dimensión finita puede ser descrito 
siempre en términos de una base ordenada por medio de una matriz. 

Supóngase que V es de dimensión finita, de modo que 


G = [ar, - . - , An) 
es una base ordenada de V y que se tiene dado un producto interno particular 


sobre V; se verá que el producto interno está completamente determinado 
por los valores 


(8-5) Gj = (ogla;) 


que tienen los pares de vectores en (3. Si a = 2 x,0%, y $ = 2 ya, entonces 
k j 
(a|B) = z Tn04|8) 

= z Tr (0118) 

= E 2% Y Y; (aula) 
k j 

= Y Y/Gjuts 
j»k 


= Y*GX 


donde X, Y son las matrices de coordenadas de a y f en la base ordenada G, 
y G es la matriz con elementos G = (a, |a,). Se llama a G la matriz del producto 
interno en la base ordenada (3. Se sigue de (8-5) que G es hermiítica, es decir, 
que G = G*; sin embargo, G es una clase de matriz hermítica más bien especial. 
En efecto, G debe satisfacer, además, la condición 


(8-6) X*GX > 0, Xx x0. 


En particular, G debe ser inversible. Ya que en caso contrario existe una X + 0 
tal que GX = 0, y para toda tal X, (8-6) es imposible. En forma más explícita. 
(8-6) dice que para los escalares x,...., x,, no todos nulos, 


(8-7) Z TÍ jr, > 0. 
d» 
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Con esto se Observa inmediatamente que cada clemento de la diagonal de G 
debe ser positivo; sin embargo, esta condición para los elementos de la diago- 
nal no es del todo suficiente para asegurar la validez de (8-6). Condiciones su- 
herentes para la validez de (8-6) se darán más adelante. 

l:l proceso anterior es reversible; esto es, si G es cualquie «natriz n x n 
sobre F que satisface (8-6) y la condición de que G = G*, entonces u es la matriz 
en la base ordenada 03 de un producto interno sobre Y. Este producto interno 
estír dado por 


(al6) = Y*GX 


donde Y e Y son las matrices de coordenadas de a y ff en la base ordenada 6. 


Hjercicios 


Í Sca V un espacio vectorial y ( | ) un producto interno sobre V. 
(1) Demostrar que (0|f) = O para todo f£ de P. 
(bh) Demostrar que si (a|f$) = O para todo ff de V, entonces x = 0. 


2. Sca V un espacio vectorial sobre F. Demostrar que la suma de dos productos internos 
wbre Y es un producto interno sobre V. ¿Es la diferencia de dos productos internos un 
producto interno? Mostrar que un múltiplo positivo de un producto interno es un pro- 
ducto interno. 


3, Describir explicitamente todos los productos internos sobre R*' y sobre C!. 
4. Comprobar que el producto interno canénico sobre F” es un producto interno. 


4, Sca (| ) el producto interno canónico sobre R?”. 


(1) Sean a = (1, 2), f = (—1, 1). Si y es un vector tal que (a|y) = —1 y (Bly) = 3, 
hallar y. 
(b) Demostrar que para cada a en R? se tiene que a = (ale, )e, + (a]e, dez. 


b. Sca ( | ) el producto interno canónico sobre R? y sea T el operador lineal T(x,. x2) = 
1), x,). Ahora, Tes la «rotación en 90*» y tiene la propiedad de que (a|Ta) = O para todo 
«cen R?. Hallar todos los productos internos [ | ] en R? tales que [a| Tx] = O para cada a. 


7. Sca ( | ) el producto interno canónico sobre C?. Demostrar que existe un operador 
lmcal no nulo en C? tal que (a|Ta) = O para cada a en C?. Generalizarlo. 


H. Sca A una matriz 2 x 2 con elementos reales. Para X, Y en F?*!. sea 


faA(X, Y) = Y'AX. 


demostrar que f, es un producto interno sobre R?*” si, y solo si, A = A', Aj, > 0, 
t., > 0 y det A > 0. 


% Sea V un espacio vectorial real o complejo con un producto interno. Demostrar que 
la forma cuadrática determinada por el producto interno cumple la ley del paralelogramo 


lla: + Bll? + lla — fl? = 2101? + 2118113. 


10. Sca ( | ) el producto interno sobre R? definido en el Ejemplo 2 y sea 43 la base or- 
denada canónica de R?. Hallar la matriz de este producto interno con respecto a GB. 
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11. Mostrar que la fórmula 


ei by = y 
A AE TES 
define un producto interno sobre el espacio R(x] de los polinomios sobre el cuerpo R. Sea 
W el subespacio de los polinomios de grado menor o igual que ».. Restringir el producto 
interno anterior a Y” y hallar la matriz de este producto interno sobre W respecto a la base 
ordenada (tl, x, ..., x”]. (Sugerencia: Para mostrar que la fórmula define un producto 
interno, Obsérvese que 


Ulla = 18 FWg(0) de 


y Operar con la integral.) 


12. Sea Y un espacio vectorial de dimensión finita y sea 6 = fa,...., q,; una base de Y. 
Sea ( | ) un producto interno sobre V. Si c,,..., €, son n escalares arbitrarios, demostrar 
que existe exactamente un vector a en V tal que (aja) = cc, j=1,..., nm. 


13. Sca V un espacio vectorial complejo. Una función J de V en V se llama 
si Jo + PB) = Ja) + HP), Jíca) = cJa) y JiJa)) = a para todo « y todo a, ff en V. Si 
J es una conjugación, demostrar que 

(a) El conjunto W de todos los a en Y tales que Ja = a es un espacio vectorial sobre 
R con respecto a las operaciones definidas en Y. 

(b) Para cada a en V existen vectores únicos f, y en W tales que a = Éf + iy. 


14. Sean V un espacio vectorial complejo y W un subconjunto de V con las siguientes 
propiedades: 
(a) W es un espacio vectorial real con respecto a las operaciones definidas en V. 
(b) Para cada x en V existen vectores únicos fi, y en W tales que a = ff + iy. Demos- 
trar que la ecuación Ja = fi — iy define una conjugación en V tal que Ja = a si, y solo si, 
x pertenece a W y mostrar también que J es la única conjugación en V con esta propiedad. 


15. Hallar todas las conjugaciones en C! y C?. 


16. Seca W un subespacio real de dimensión finita de un espacio vectorial complejo Y. 
Demostrar que W satisface la condición (b) del Ejercicio 14 si, y solo si, cada base de W es 
también una base de Y. 


17. Sean V un espacio vectorial complejo. J una conjugación sobre Y, W el conjunto 
de los x de V tales que Jx = 2 y f un producto interno sobre W. Demostrar que: 

(a) Existe un producto interno único g en V tal que ga, f$) = fía, fB) para todo 
z. PB en W. 

(b) glJa, JB) = g(f. a) para todo a, ff en V. 
¿Qué dice la parte (a) respecto a la relación entre Jos productos internos canónicos sobre 
R* y C! o sobre R” y C”? 


8.2. Espacios producto interno 
J 
Ahora que se tiene una idea de lo que es un producto interno, se atenderá 
a lo que se puede decir al respecto de la combinación de un espacio vectorial 
y un producto interno particular sobre el mismo. Especificamente se estable- 
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coran las propiedades básicas de los conceptos de «longitud» y «ortogonali- 
dad» que son impuestos al espacio por el producto interno. 


Definición. Un espacio producto interno es un espacio real o complejo junto 
cop un producto interno definido sobre ese espacio. 


Lin espacio producto interno real de dimensión finita se llama a menudo 
espacio cuclidiano. Un espacio con producto interno complejo se llama a veces 
espacio unitario. 


Teorema 1. Si V es un espacio producto interno, entonces para vectores 
,, ff cualesquiera de V y cualquier escalar c 


(i) call = le] led; 

(i1) fal] > O para a 4 0; 
(iii) [(0:]8)] < llo] []8I): 
(iv) lla + Bl] < (la]] + [1811. 





Demostración. Las afirmaciones (1) y (11) se desprenden casi inmediatamen- 
tu de las varias definiciones vistas. La desigualdad en (111) es claramente válida 
pira a = 0. Si a + 0, hágase 


_ (bla) 
== pe 





Fintonces (y|a) = 0 y 





o< Ill = ( — a 





_ Bla). 
2 = lla] ) 


= (aa) - AA 


|[(a]6)1* 
== 2 — . 
[181] lla]? 





luego |(a]8)? < l]all?I|B]I?. Ahora usando (c) se tiene que 


lla + Bll2 = llal|2 + (aJ8) + (Bla) + 11811? 
= |la||? + 2 Re (a]8) + 11811? 
< |jal12 + 2 |lal! 11811 + 1811? 
= (lla]] + [1611)?. 


con lo que lla + Bl] < lol] + [|Bl|. 8 


La desigualdad en (111) se llama desigualdad de Cauchy-Schwarz y tiene una 
amplia variedad de aplicaciones. La demostración muestra que si (por ejemplo) 
, es cero, entonces |(a|8)| < lla] |] BI] a menos que 


(Bla) 


la]j= 4 





p = 


eri 
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Asi, la igualdad se tiene en (111) si, y solo si, a y f son lincalmente dependientes. 


Ejemplo 7. Si se aplica la desigualdad de Cauchy-Schwarz al producto 
interno dado en los Ejemplos 1, 2, 3 y 5 se obtiene lo siguiente 


(a) [2 23 < (2 2) AZ ly1 12) 1? 
(b) [21Y1 — 2eY1 — 21Y2 + 4xoyol 

< ((x1 — 22)? + 342) "(y — ya)? + 3y2) "2 
(c) [tr (ABS)] < (tr (44*)"2(tr (BB*))12 


a | |< (for a)” (floor as)”. 


Definiciones. Sean a y f vectores de un espacio producto interno V. Entonces 
a. es ortogonal a $ si (a|B) = O; como esto implica que f es ortogonal a a, a menu- 
do solo se dirá que a y fPB son ortogonales. Si S es un conjunto de vectores de V, se 
dice que S es un conjunto ortogonal siempre que todos los pares de vectores dis- 
tintos de S sean ortogonales. Un conjunto ortonormal es un conjunto ortogonal 
S con la propiedad además de que |la|| = 1 para todo a. de S. 


El vector cero es ortogonal a todo vector en V y es el único vector con esa 
propiedad. Es apropiado pensar un conjunto ortonormal como conjunto de 
vectores mutuamente perpendiculares que tienen longitud 1. 


Ejemplo 8. La base canónica en R” o C” es un conjunto ortonormal con 
respecto al producto interno canónico. 


Ejemplo 9. El vector (x, y) de R? es ortogonal a (—y, x) con respecto 
al producto interno canónico; en efecto, 


((2, yll—y, 2)) = —xy + yz =p. 


Sin embargo, si R? está dotado del producto interno del Ejemplo 2, entonces 
(Qx, y) y (—y, x) son ortogonales si, y solo si, 
y = 2 (-3>=w Vl3)z. 
Ejemplo 10. Sea V = C"*” el espacio de las matrices complejas n x hn, 
y sea EP-* la matriz cuyo único elemento no nulo es un 1 en la fila p y la columna q. 


Entonces el conjunto de todas las matrices E”? es ortonormal con respecto al 
producto interno dado en el Ejemplo 3. En efecto, 


(Er|Er*) = tr (Er E") = 8, tr (EP) = 8q5Ópr. 


Ejemplo 11. Sea V el espacio de las funciones continuas de valor complejo 
(o valor 'real) en el intervalo 0 < x < 1 con el producto interno 


> (1la) = E ¡WI dx. 


Supóngase que f(x) = V2 cos 2rnx y que gníx) = V2 sen 2anx. Entonces 
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Dti Zi /.£,.-.! es un conjunto infinito ortonormal. En el caso complejo 
se pueden formar también las combinaciones lineales 
1 . 
Y Ur + 90), n=1,2,.... 


de este modo se tiene un nuevo conjunto ortonormal S que consta de todas 
lis funciones de la forma 


hala) = etr+rz, n= >+1,3+32,.... 


ll conjunto S* que se obtiene de S adjuntando la función constante 1 es también 
ortonormal. Se supone aquí que el lector está familiarizado con el cálculo de 
las imtegrales en cuestión. 


l.os conjuntos ortogonales dados en los ejemplos anteriores son todos lineal- 
mente independientes. Se ve ahora que necesariamente éste es el caso. 
Teorema 2. Un conjunto ortogonal de vectores no nulos es linealmente 


mdependiente. 


Demostración. Sea S un conjunto ortogonal finito o infinito de vectores 
no nulos en un espacio con producto interno dado. Supóngase que 0;, Oz, . . . > 
son vectores distintos en S y que 


B = Cioy + C202 + -** + Cm0tm- 
I-ntonces 


(Blaz) = (2 cjaj|ar) 
3 

= Y c¡(aJo1) 
J 


= Cxlaz|az). 
Como (a la,) + 0, se sigue que 


— (blas) 1I<k<m. 


Ma? ES 


Así, cuando f = 0, cada c, = 0, de modo que S es un conjunto independiente. |] 


Corolario. Si un vector f es combinación lineal de una sucesión ortogonal 





de vectores no nulos A;, ..., %,, entonces fB es igual a la combinación lineal 
particular 

m (Blax) 
(8-8) B= 2 Ok. 

=1 |]o4]|? 


Este corolario se desprende de la demostración del teorema. Hay otro co- 
rolario que mencionar que es también obvio. Si [a,, ..., a,,) es un conjunto 
ortogonal de vectores no nulos en un espacio con producto interno de dimen- 
sión finita V, entonces m < dim V. Esto dice que el número de direcciones 
mutuamente perpendiculares en Y no pueden exceder la dimensión algebraica- 
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mente definida de V. El máximo número de direcciones mutuamente perpen- 
diculares en V es lo que intuitivamente se considera como dimensión geomé- 
trica de V, y se acaba de ver que ésta no es mayor que la dimensión algebraica. 
El que estas dos dimensiones sean iguales es un corolario particular del siguiente 
resultado. 


Teorema 3. Sea V un espacio con producto interno y sean B,, ...., B,, vec- 
tores independientes cualesquiera de V. Entonces se pueden construir vectores 
ortogonales %,, ..., a, en V tales que para cada k = 1, 2,...,n el conjunto 


(Ap, > Oj 
sea una base del subespacio generado por fi, ...., By. 


Demostración. Los vectores 4;,, ..-, 0, se obtendrán por medio de una 
construcción conocida como proceso de ortogonalización de Gram-Schmidt. 
Primero, sea a, = f,. Los otros vectores están entonces dados inductivamente 
de la siguiente forma: supóngase que %,,..., %,, (1 < m < n) hayan sido ele- 
gidos de modo que para cada k 


lo, -.., 0, 1<k<m 


es una base ortogonal para el subespacio de V que es generado por f,,..., fr. 
Para construir el siguiente vector a, ,, sea 


S (Br+ijo 
¿ m+1] Uk 
(8-9) Om+1 = Bm41 — Y Grsrlos) Ak. 
¿=1 [|x| 
Entonces a, +, + 0. En efecto, ya que en caso contrario a,,,, es una combi- 
nación lineal de los %,,..., 0,, y luego una combinación lineal de los x,,..., %,,. 
Además, si 1 < j < m, entonces 


” (Bm+ilo;) 


(Am+11a;) = (Bm+1105) — A, ATE (ax|a:;) 


= (Bm+1105) —- (Bm+110;) 
= 0. 


Por tanto, (%,, ..., %, +1) es un conjunto ortogonal que consta de m + 1 vec- 
tores no nulos en el subespacio generado por f,,..., fi, +1. Por el Teorema 2, 
él es una base para este subespacio. Así los vectores a,, ..., Y, pueden cons- 
truirse uno tras otro de acuerdo con (8-9). En particular, cuando n = 4, se 
tiene 











01 = Br 
02 = Pa — CT 1 
-10 
SA — y — les), — (Bild), 
A E TE TIOS 


(Bala)  _ (Balaz) (Balor3) 


04 = Ba ao ap? 27 asa + E 
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Corolario. Todo espacio con producto interno de dimensión finita tiene una 
base ortonormal. 


Demostración. Sean V un espacio con producto interior de dimensión 
imita y 1f8,, .-., B,j una base para V. Aplicando el proceso de Gram-Schmidt, 
se construye una base ortogonal (4,, ..., A, ). Entonces, para obtener una base 
ortonormal, se remplaza simplemente cada vector a, por 0,/llo,l. Y 


Una de las ventajas principales que tienen las bases ortonormales sobre 
las bases arbitrarias es que los cálculos en que entran coordenadas son más 
simples. Para indicar en términos generales por qué es así, supóngase que V es 
nn espacio con producto interior de dimensión finita. Entonces, como en la 
ultima sección, se puede usar (8-5) para asociar la matriz G con cada base orde- 
nada BHf = (0%,, ..., 0,) de V. Usando esta matriz 


Gir = (ax|a), 
se puede calcular el producto interno en términos de las coordenadas. Si 6 es 
una base ortorormal, entonces G es la matriz unidad, y para cualesquicra 
escalares x; € yy 
z 20,12 Y:0y) = 2 TY; 


Con lo que, en términos de una base ortonormal, el producto interno en V se 
asemeja al producto interno canónico en F"”. 

Aunque es poco útil para los cálculos, es interesante observar que el pro- 
cuso de Gram-Schmidt puede ser también usado como criterio de independen- 
cia lineal. En efecto, supóngase que f,, .... f, son vectores linealmente de- 
pendientes en un espacio con producto interno V. Para excluir el caso trivial, 
supóngase que f, + O. Sea m el mayor entero para el que los f,, ...., f,, son 
mdependientes. Entonces l < m < n. Sean Qi, ..., %m los vectores obtenidos 
por la aplicación del proceso de ortogonalización a los f,, ..., f,,. Entonces 
cl vector a,, ., dado por (8-9) es necesariamente 0. En efecto, 0,,,, está en el 
subespacio generado por X,,...,a,, y es ortogonal a cada uno de estos vec- 
tores; luego es.0 por (8-8). Recíprocamente, Si %Xr, ..., A, son distintos de O y 
X+1 = 0, entonces fB,, ..., B,.+, Son lmealmente dependientes. 


Ejemplo 12. Se consideran los vectores 


B1 = (3,0, 4) 
PB2 = (—1, O, 7) 
B3 = (2, 9, 11) 


en R? con el producto interno canónico. Aplicando el proceso de Gram-Schmidt 
a los fB,, B,, fP3, se obtienen los siguientes vectores 

q = (3, 0, 4) 

Oe = (—1, O, 7) _ (—1, 0, DIG, 0, 4)) (3, O, 4) 


25 


, 0, 7) > (3, O, 4) 
0, 3) 


(—1 
= (4 , 


, 
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= 2,9, 119) - C%1D16,0,4) 0, 4 


25 
= (2, 9, 11) — 2(3, 0, 4) — -4, 0, 3) 
= (0, 9, 0). 


(4, O, 3) 


Estos vectores son evidentemente no nulos y mutuamente perpendiculares. 
Luego fa,, %,, 3) es una base ortogonal para R*. Para expresar un vector ar- 
bitrario (x,, x,, x3) en R?* como combinación lineal de los %,, %,, %, nO es Nne- 
cesario resolver ninguna ecuación lineal. Para ello es suficiente usar (8-8). Así, 


311 + 4x3 —4x1 + 323 


(21, La, 23) = 25 1 + 95 


as + > A 
como se verifica rápidamente. En particular, 
(1, 2,3) = 2 (3,0, 4) + 3 (4,0, 3) + % (0, 9, 0). 
Para ver esto desde otro punto de vista, lo que se tiene es lo siguiente: la base 


£fi. fa, fa) de (R?y*, que es dual de la base fa,, a,, a), está definida explici- 
tamente por: 


3 4 
fas, 22, 2) - Y 
—4 
falx1, Ta, 23) = A 


To 
falar, 2) 23) = A 


Je 


y estas ecuaciones pueden ser escritas en forma más general como 


(za, La, 23) la). 


Íj(x1, To, E) = Jo]? 


Finalmente, obsérvese que de d«,, A,, ay se tiene la base ortonormal 


3 (3, 0, 4), 5 (4, O, 3), (0, 1, 0). 


Ejemplo 13. Sea A = h 2] , donde «, b. c y d son números comple- 
jos. Se hace fB, = (a, b), PB, = (c, d) y se supone que ff, + 0. Si se aplica el pro- 
ceso de ortogonalización a f,, f$,, usando el producto interno canónico en C?, 


se obtienen los siguientes vectores 


a] = (a, b) 
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((c, d)|(a, d)) 


QU = (c, d) == aj? + [o]? (a, b) 
(cá + db) Ñ 
SN 


_ (E — dba dáa — 2) 
la]? + [o]? Ja]? + [bl? 


det A po 
= ap pp 2 


Ahora la teoría general dice que a, + 0 si, y solo si, f,, f$, son linealmente 
idependientes. Por otro lado, la fórmula para a, muestra que este es el caso 
sr. y solo si, det 4 $0. 


En esencia, el proceso de Gram-Schmidt consiste en la aplicación repetida 
de una Operación geométrica básica llamada proyección ortogonal, y se le en- 
tiende mejor desde este punto de vista. El método de la proyección ortogonal 
tinmbién aparcce en forma natural en la solución de un importante problema 
de aproximación. 

Supóngase que W es un subespacio de un espacio con producto interno Y. 
y sea f un vector arbitrario en V. El problema consiste en hallar una mejor 
aproximación posible a fí por vectores de W. Esto quiere decir que se desea 
encontrar un vector a. para el que ||f — a]] sea lo más pequeño posible, sujeto 
«a la restricción de que a debe pertenecer a W. Precisemos lo dicho. 


Una mejor aproximación a ff por vectores de W es un vector a de W tal que 


18 — all < 116 — ql 


para todo vector y en W. 

Observando este problema en R?, o en R?, se ve intuitivamente que Una 
mejor aproximación a fí por vectores de W debe ser un vector a de W tal que 
[í — a es perpendicular (ortogonal) a W y que tal a debe ser único. Estas idcas 
intuitivas son correctas para subespacios de dimensión finita y para algunos, 
pero no todos, los subespacios de dimensión infinita. Dado que la situación 
precisa es demasiado complicada de tratar aquí, se demostrará solo el siguien- 
te resultado. 


Teorema 4. Sea W un subespacio de un espacio producto interno V y sea RP 
un vector de V 


(1) El vector a en W es una mejor aproximación a f, por vectores de W 
si, y solo si, B| — a es ortogonal a todo vector de W 
(11) Si existe una mejor aproximación a f por vectores de W es única. 
(111) Si W es de dimensión finita y La,, ..., %,j es cualquier base ortonor- 
mal de W, entonces el vector 


a =Y (Bjoz) 


— ¡04 
x llo]? 


es la (única) mejor aproximación a f por vectores de W. 





ty 
e - 
us 
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Demostración. Primeramente, obsérvese que st y es cualquier vector de Y. 
entonces $ — y = (fB — a) + (a — y), y 


18 — yll? = [18 — al]? + 2 Re (8 — aja — y) + ]la — y]l2. 


Supóngase ahora que f — a es ortogonal a todo vector de W, que y está en W y 
que y + a. Entonces, como a — y está en W, se sigue que 


18 — vll? = ]]8 — all? + lla — y]1* 
> 118 — all? 
Recíprocamente, supóngase que ||fB — yl] > ||f8 — al] para todo y en E. 
Entonces de la primera ecuación anterior se sigue que 
2 Re (8 — aja — y) + lla — yl? > 0 
para todo y de W. Como todo vector de W puede ser expresado en la forma 
a — y con y en W, se ve que 
2Re (8 — ajr) + Ir]? > 0 
para todo T en W. En particular, si y está en W y y + a, se puede tener 
(8 — ala — y) 
MW la — 0). 
Te 
Entonces, la desigualdad se reduce a la afirmación 


T = 


-9 1(6 — alo > y)|? + [66 — ala 2 y)? > 0. 

la — y/1? lla =p. + 
Lo cual se cumple si, y solo si, (B — xfa — y) = 0. Por tanto, f — a es orto- 
gonal a todo vector en W. Esto completa la demostración de la equivalencia 
de las dos condiciones para a dadas en (1). La condición de ortogonalidad es 
evidentemente satisfecha por, a lo más, un vector de W, lo que demuestra (11). 
Ahora supongase que W es un subespacio de dimensión finita de Y. Enton- 
ces se sabe, por un corolario del Teorema 3, que W tiene una base ortogonal. 
Sea [%,, ..., 0%) cualquier base ortogonal para W, y se define a por (8-11). 
Entonces, por el cálculo hecho en la demostración del Teorema 3, f$ — a es 
ortogonal a cada uno de los vectores a, (f — « es el vector obtenido en la últi- 
ma etapa cuando se aplica el proceso de ortogonalización a A,, ..., %. $). 
Así f — a es ortogonal a toda combinación lineal de los x,, ..., «a,, es decir, 
a todo vector en W. Si y está en W y y + a, se sigue que |]8 — y|] > [18 — all. 

Por tanto, a es la mejor aproximación a f que está en W. 


Definición. Sea V un espacio producto interno y S cualquier conjunto de 
vectores en V. El complemento ortogonal de S es el conjunto S* de los vectores 
de V ortogonales a todo vector de $. 


El complemento ortogonal de V es el subespacio cero y, recíprocamente, 
(0) = V. Si S es cualquier subconjunto de Y, su complemento ortogonal S* 
(S perp) es siempre un subespacio de V. En efecto, como S* no es vacío, por 
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contencr al 0, y toda vez que a y fí están en S* y ce es escalar cualquiera, se 
tiene 


c(aly) + (Bl) 
cO+0 
=0 


(ca + Bly) 


para cada y en S, así ca + $ también está:en S*. En el Teorema 4,.la propie- 
dad característica del vector a es que es el único vector de W' tal que f — a per- 
lenece a W? 


Definición. Siempre que exista el vector a en el Teorema 4 se le llama proyección 
ortogonal de f sobre W. Si todo vector de V' tiene proyección ortogonal sobre W, 
la uplicación que asigna a cada vector de V su proyección ortogonal sobre W, se 
lhuma proyección ortogonal de V sobre W. 


Por el Teorema 4, la proyección ortogonal de un espacio producto interno 
sobre un subespacio de dimensión finita siempre existe. Pero el Teorema 4 también 
implica el siguiente resultado. 


Corolario. Sean V un espacio producto interno, W un subespacio de dimen- 
sion finita y E la proyección ortogonal de V sobre W. Entonces la aplicación 


pB= P — EP 
es la proyección ortogonal de V sobre W?. 


Demostración. Sea fí un vector arbitrario de V. Entonces f — Ef está 
en W y para cualquier y en W?, ff — y = Ef + (B — Ef — y). Como Ef está 
en W y 6 — Ef — y está en W?, se sigue que 


118 = yl]? = ¡[Egll? + [ls — Ef — ll? 
> 118 — (8 — EB)l? 
que hace más estricta la desigualdad cuando y + f — Ef. Por tanto, f — Ef 
us la mejor aproximación a ff para vectores en W!?. 


Ejemplo 14. Se da a R* el producto interno canónico. Entonces la pro- 
vección ortogonal de (— 10, 2, 8) sobre el subespacio W generado por (3, 12, —1) 
us el vector 


a = ((- 10, 2, 8163, 12, —1)) 


9+ 144 + 1 (3, 12, —1) 


—14 
= 7 812 —1. 


la proyección ortogonal de R? sobre W es la transformación lineal E -defini- 
da por 


12%, — 
(21, 22, 23) > Es? + 7 aL 22) (3, 12, —1). 
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La imagen de E es evidentemente 1; luego su nulidad es 2. Por otro lado. 
Elx,, L2, 23) - (0, O, 0) 


st, y solo si, 3x, + 12x, = x3 = 0. Este es el caso si, y solo si, (x,, Xx, x3) está 
en W?. Por tanto, W* es el espacio nulo de E, y dim (W*) = 2. Calculando 


3 12x2 — zx z 
(L1, Lz, Ta) — (A) (3, 12, —i) 


se ve que la proyección ortogonal de R* sobre W” es la transformación lineal 
IT — E que aplica el vector (x,, x,, x3) sobre el vector 
1 


154 (1452, — 3612 + 323, —36x1 + 10x2 + 12:x3, 3x1 + 12x2 + 15323). 


Las observaciones hechas en el Ejemplo 14 se generalizan de la siguien- 
te forma. 


Teorema 5. Sea W un subespacio de dimensión finita de un espacio pro- 
ducto interno V y sea E la proyección ortogonal de V sobre W. Entonces E es una 
transformación lineal idempotente de V sobre W, W?* es el espacio nulo de E y 


V= Woaw!. 


Demostración. Sea f un vector arbitrario en V. Entonces Ef es la mejor 
aproximación a f que está en W. En particular, Ef = ff cuando ff está en W. 
Por tanto, E(Ef) = Ef para todo f en V; esto es, E es idempotente: E? = E. 
Para demostrar que E es una transformación lineal, sean a y f] vectores cuales- 
quiera de Y y c un escalar arbitrario. Entonces, por el Teorema 4, a — Ex y 
fp — Ef son ambos ortogonales a todo vector de W. Luego el vector 


cla — Ea) + (8 — EB) = (ca + B) — (cEa + EB) 


también pertenece a W?*. Como cEu + Ef es un vector de W, se sigue del Teore- 
ma 4 que 


E(ca + 6) = cEa + Ef. 


Por cierto que se puede también demostrar la linealidad de E usando (8-11). 
Nuevamente, sea $ un vector cualquiera de V. Entonces E es el vector único 
de W tal que 6 — Ef está en W*. Así, Ef = O cuando $ está en W*. Recípro- 
camente, f está en W* cuando Ef = 0. Así W! es el espacio nulo de E. La 
ecuación 


B =EB+8- ES 


muestra que V = W + W+; más aún, W (1 W? = [0]. En efecto, si a es un 
vector de W (y W?, entonces (ala) = 0. Por tanto, a = 0 y V es la suma di- 
recta de W y W!?, |] 


Corolario. Bajo las condiciones del teorema, I — E es la proyección orto- 
gonal de V en W!?. El es una transformación lineal idempotente de V en W* con 
espacio nulo W. 
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Demostración. Acabamos de ver que la aplicación f => f — Ey es la pro- 
yección ortogonal de Y sobre W*. Como E es una transformación lineal, esta 
proyección en W* es la proyección lineal / — E. Por sus propiedades geomé- 
(ricas se ve que 7 — E es una transformación idempotente de V sobre W. Esto 
también se desprende del cálculo 


1U-EGU—-E)=1-E-E+E? 
=1I-—E. 


Además, (1 — EJf$ = 0 si, y solo si, B| = Ef, y este es el caso si, y solo si, $ está 
en W. Por tanto, W es el subespacio nulo de 7] — E. |] 


El proceso de Gram-Schmidt puede ser ahora descrito geométricamente 
del siguiente modo. Dado un espacio producto interno Y y los vectores f,....., $, 
en Y, sea P, (k > 1) la proyección ortogonal de V en el complemento ortogonal 


del subespacio generado por $,,..., fP;-, y sea P, = [ Entonces, los vectores 
que se obtienen por aplicación del proceso de ortogonalización a f,, ..., ÉB,, 
están definidos por las ecuaciones 

(8-12) o = PiBs, 1I<k<mnm. 


El Teorema $5 implica otro resultado conocido como desigualdad de Bessel. 


Corolario. Sea [9,. ..., a, un conjunto ortogonal de vectores no nulos 
en un espacio producto interno V. Si fí es cualquier vector de V, entonces 
y Bla)? < BI? 
S E 
x lloc | 


v la desigualdad vale si, y solo si, 
(Blow), 
p=Y 
x llag[I? A 
Demostración. Sea y = 2 L(Blo Y 104,117] %,. Entonces f = y + O, donde 
k 
(yl9) = O. Luego 


11611? = lvl? + [la]. 


Es ahora suficiente demostrar que 


y edh. 
2= 
lll 2 Ala? TE 


Este es el cálculo rutinario en el que se usa el hecho de que (a,lx,) = 0 para 


jAk. Ml 


En el caso especial en que (%,, ..., 0, es un conjunto ortonormal, la des- 
igualdad de Bessel dice que 


2 [(éla!? < Iléll. 
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El corolario dice también, en este caso, que fí está en el subespacio generado 
por [%;, ..., 0.) sit, y solo si, 


fp = z (Blox) cu 


O si, y solo si, la desigualdad de Bessel es efectivamente una igualdad. Por cier- 
to que en el caso en que Y sea de dimensión finita y [a,, ..., 0,) es una base 
ortogonal de Y, la fórmula anterior rige para todo vector f en V. En otras pa- 
labras; si (01, .... 0,j es una base ortonormal de V, la k-ésima coordenada 
de f en la base ordenada (a,, ..., a,y es (B|o,). 


Ejemplo 15. Se aplicará el último corolario al conjunto ortogonal des- 
crito en el Ejemplo 11. Hallamos que 


n 1 rito 1 
(a) 3 foral (ora 
1 n A 2 n 
(b) ]/ Lz cre? i dt = ¿E ll 





(c) E (V2 cos 211 + V2 sen 411)? dt =1+1=2. 


Ejercicios 


l. Considerar R*, con el producto interno canónico. Sea W el subespacio de R* que consta 
de todos los vectores ortogonales a a = (1, 0, —1, 1) y f| = (2, 3, —1, 2). Hallar una base 
de W. 


2. Aplicar el proceso de Gram-Schmidt a los vectores f3, = (1, 0, 1), ff, = (1, 0, —1), 
Pz = (0, 3, 4) para obtener una base ortogonal para R? con el producto interno canónico. 


3. Considerar C? con el producto interno canónico. Hallar una base ortonormal para 
el subespacio generado por f, = (1, 0, i) y fB2¿= Q, 1, 1! + 1). 


4. Sea V un espacio producto interno. La distancia entre los vectores x y fí en Y está de- 
finida por 


día, Bb) = lla —> Bll. 


Demostrar que 
(a) dí(a, $) > 0; 
(b) d(a, $) = 0 si, y solo si, a = ff; 
(c) día, f$) = a(f, a); 
(d) d(a, f$) < día, y) + ad(>, B). 


5. Sea V un espacio producto interno y sean a, f3 vectores de V. Demostrar que a = $$ 
si, y solo si, (a|y) = (f|y) para todo y de PF. 
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O. Sca MH el subespacio de KR? generado por el vector (3, 4). Usando el producto interno 
canónico, seca /. la proyección ortogonal de R? sobre W. Hallar 

(a) una fórmula para E(x,, x):; 

(b) la matriz de E cn la base ordenada canónica; 

(0) W?; 

(4) una base ortonormal en que E está representada por la matriz 


F 0 
o oJ 
7. Sea V el espacio producto interno que consta de R? y el producto interno cuya forma 
uuadrática está definida por 
llGa, mall? = (1 — 23)? + 323. 


Sua E la proyección ortogonal de Y sobre el subespacio M” generado por el vector (3, 4). 
Responder ahora las cuatro preguntas del Ejercicio 6. 


8. Hallar un producto interno sobre R? tal que (e,, €,) = 2. 


9. Sea V el subespacio de polinomios R[x] con grado a lo más 3. Dótese V con el pro- 
ducto interno 


1 
(Ma) = f, 1090 de. 


la) Hallar el complemento ortogonal del subespacio de polinomios escalares; 
(b) Aplicar el proceso de Gram-Schmidt a la base (1, x, 12, x*. 


IO. Sea V el espacio vectorial de todas las matrices n x n sobre C, con el producto inter- 
no (4|B) = tr (4B*). Hallar el complemento ortogonal del subespacio de matrices dia- 
gonales. 


M. Sea V un espacio producto interno de dimensión finita y sea (a,, ..., %,) una base or- 
tonormal de Y. Demostrar que para vectores a, fó cualesquiera de V 


(018) = 2 (olaa. 


12. Sea W un subespacio de dimensión finita de un espacio producto interno V y sea E 
la proyección ortogonal de Y sobre W. Demostrar que (Ex|B) = (a| Ef) para todo a, f en V. 


13. Sea S un subconjunto de un espacio producto interno Y. Demostrar que (S*)* con- 
tiene al subespacio generado por S. Cuando V es de dimensión finita, mostrar que (S*)* 
es el subespacio generado por $. 


14. Sea V un espacio producto interno de dimensión finita y sea GB = (a,,..., a,] una 
base ortonormal de Y. Sea T un operador lineal sobre V y A la matriz de T en la base or- 
denada (Rf. Demostrar que 


Asi = (Ta; jas). 


15. Supóngase que V = W, 6 W, y que f, y f, son productos internos en W, y W,, 
respectivamente. Demostrar que existe un producto interno único f sobre V tal que 
(a) W, = WE; 
(b) fla, f$) = Jxla, $), cuando a, ff están en W,, k = 1, 2. 


16. Sea V un espacio producto interno y W un subespacio de V de dimensión finita. Exis- 
ten (en general) muchas proyecciones que tienen a YY como imagen. Una de éstas, la pro- 
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yección ortogonal sobre W, tiene la propiedad de que ||£xw)| < lla] para todo a de Y. De- 
mostrar que si £ es una proyección con imagen W, tal que || Ex/| < lla] para todo «a de Y, 
entonces E es la proyección ortogonal sobre W. 


17. Sea Y el espacio prodlucto interno real que consta del espacio de las funciones conti- 
nuas de valor real en el intervalo —1 < £ < 1, con el producto interno. 


do = f 1090 a. 


Sea W el subespacio de las funciones impares, es decir. las funciones que satisfacen f(—t) = 
— f(t). Hallar el complemento ortogonal de W. 


8.3. Funciones lineales y adjuntas 


La primera parte de esta sección se dedicará a los funcionales lineales sobre 
un espacio producto interno. El resultado principal es que cualquier funcional 
lineal f sobre un espacio producto interno de dimensión finita es «un producto 
interno con un vector fijo en el espacio»; es decir, que tal f tiene la forma f(a) = 
(«| $) para algún fi fijo de V. Se usará este resultado para demostrar la existencia 
del «adjunto» de un operador lineal 7 sobre V, siendo éste un operador lineal 
T* tal que (Ta]f$) = («| T*f) para todo a y f en V. Por el uso de una base or- 
tonormal, esta operación adjunta sobre operadores lineales (que pasa de T 
a T*) se identifica con la operación de formar la transpuesta conjugada de una 
matriz. Exploramos someramente la analogía entre la operación adjunta y la 
conjugación de números complejos. 

Sea Y cualquier espacio producto interno y sea f un vector fijo de V. Se 
define una función /, de V en el cuerpo escalar por 


fgla) = (al6). 


Esta función f¿ es un funcional lineal sobre V, ya que por su propia definición, 
(0:]f8) es lineal como función de a. Si Y es de dimensión finita, todo funcional 
lineal sobre Y se puede expresar de esta forma para cierto f. 


Teorema 6. Sean V un espacio producto interno de dimensión finita y f un 
funcional lineal sobre V. Entonces, existe un único vector f de V tal que fla) = (a|f) 
para todo x de V. 


Demostración. Sea Ía;, 0%, ..., 0,) una base ortonormal de V. Se hace 
n 
(8-13) fB = z faja; 
y= 


y sea fg el funcional lineal definido por 


fala) = (al8). 
Entonces 


falou) = (ox) 2 /(0)0) = f(as). 
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Como esto es cierto para todo a,, se sigue que f = f¿. Ahora supóngasce que 
y es un vector de V para el que (af) = (ay) para todo a. Entonces (f — y|f — 
,)=0y $ = y. Así existe exactamente un vector $ que determina al funcional 
lincal f en la forma establecida. | 





La demostración de este teorema puede alterarse ligeramente en el caso de 
la representación de los funcionales lineales en una base. Si se elige una base 
ortonormal [a,, ..., 0, para V, el producto interno de a = x,0, + ++: + 
Min y P = y/%] +oc:+ Y nn será 


(a18) = añ + --- + ZaJn. 
Si f es un funcional limeal cualquiera sobre V, entonces f tiene la forma 
fla) = 41 + +:*: +CrtTn 


para escalares fijos C,. .... C, determinados por la base. Ciertamente, c, = 
/(a,). Si se desea encontrar un vector f en V tal que (a|f$) = fía) para todo a, en- 
tonces es evidente que las coordenadas y, de f deben satisfacer P¿= c; 0 y; = 
/(2,). Por consiguiente, 


B = flaya + +++ + Hana, 


es el vector que se desea. 

Unos comentarios al respecto. La demostración del Teorema 6 que se ha 
dado es muy breve, pero no resalta el hecho geométrico esencial de que $ está 
en el complemento ortogonal del espacio nulo de f. Sea W el espacio nulo de f. 
IiEntonces Y = W + W* y f está completamente determinado por sus valores 
en W?*. En efecto, si P es la proyección ortogonal de Y sobre W*, entonces 


f(a) = f(Pa) 


para todo a de Y. Supóngase que f m O. Entonces f es el rango 1 y dim (W?) = 1. 
Si y es otro vector no nulo cualquiera de W?, se sigue que 


_ (aly) 
Pa = mE Y 





para todo a en V. Así, 





= (al LW 
fla) ( y) lv]? 


para todo a, y 8 = [f(W/llvll?] y. 


Ejemplo 16. He aquí un ejemplo que muestra que el Teorema 6 no es cier- 
to sin la suposición de que V es de dimensión finita. Sea V el espacio vectorial 


de los polinomios sobre el cuerpo de los números complejos, con el producto 
mterno 


(fla) = I/ fOJÓO de. 
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Este producto interno también puede ser definido algebraicamente. Si 
f=Xax* y g = E b,x*, entonces 


1 
= Y -— 5 aj. 
(119) NN 
Sea z un número complejo fijo y sea L el funcional lineal «evaluación en z': 
LAN =$). 


¿Existe un polinomio g tal que (flg) = L(f) para todo f? La respuesta es no; 
en efecto, supóngase que tenemos que 


1) = [$090 at 


para todo f. Sea h = x — z, de modo que para cualquier f se tenga que (Af) = 0. 
Entonces 


1 L— 
0= [AOF0I dr 
para todo f. En particular, esto rige cuando f = hg, con lo que 


[7 Incoirlgto! ar = 0 


y asi hg = 0. Como h £ 0, debe tenerse que g = 0. Pero £ no es el funcional 
cero; Juego no existe tal g. 

Se puede generalizar algo el ejemplo para el caso donde L sea combinación 
lineal de evaluaciones puntuales. Supóngase que se eligen números complejos 
fijos Z,, ..., 2, y escalares C,, ..., Cn, y sea 


LA = afila) + -:- + CrF(2n). 


Entonces £ es un funcional lineal en V, pero no existe g tal que L(f) = (f lg), 
al menos que (, = €, =*** =C, = 0. Solo debe repetirse el razonamiento 
anterior con h = (x — z,) ::* (x — Z,). 

Se vuelve ahora al concepto del adjunto de un operador lineal. 


Teorema 7. Para cualquier operador lineal T en un espacio producto in- 
terno de dimensión finita. existe un único operador lineal T* sobre V tal que 


(8-14) (Ta|f) = (a]T*B) 
para todo 2, fB de V. 


Demostración. Sea f$ un vector cualquiera de Y. Entonces a —> (Ta|f) es 
un funcional lineal sobre V. Por el Teorema 6 existe un único vector f' en V tal 
que (Ta|]f) = (a|f8") para todo a en V. Sea T* la aplicación PB Pf”: 


6” = T*B. 


Se tiene (8-14), pero se debe verificar también que T* es un operador lineal. 
Sean $, y en V y sea c un escalar. Entonces para cualquier «, 


hartos con prodi lo mtierdo Y] 


(a T*"(rB + y)) = (Talcg + y) 
(TalcB) + (Taly) 
= E(Talf) + (Taly) 
= Ela] T*B) + (a T*y) 
(a|cT*B) + (a T*y) 
= (ajeT*B + T*y). 


Ai HB + y) = cTFB + T*y, y T* es lineal. 

l 1 unicidad de T* es inmediata. En efecto, para cualquier f en Y, el vector 
I * [3 está univocamente determinado como el vector f” tal que (Ta|f) = (a]f") 
para todo a. | 


Icorema 8. Sea V un espacio producto interno de dimensión finita y seu 
de (0%, --., %,) una base (ordenada) ortonormal de V. Sea T un operador 
lmcal sobre V y sea A la matriz de T en la base ordenada (B. Entonces A,, = 
(Jr 2 ). 


Demostración. Como (3 es una base ortonormal, se tiene que 
n 
a = 2, (ajaJas. 


lu matriz A está definida por 


Ta; = 
k 


Ma 


Á ¡Qs 
1 
Y como 


Ta; = PA (Tajla)Jas 


Corolario. Sea V un espacio producto interno de dimensión finita y sea 
l un operador lineal sobre V. En cualquier base ortogonal de V la matriz de T* 
vs la conjugada de la transpuesta de la matriz de T. 


Demostración. Sea B = [%,, ..., 0%,) una base ortonormal de V, sea 
tl = [Tlg y B= [7*]g. De acuerdo con el Teorema 8, 


Aj = (Ta¡[a;) 
Bi; = (T*a; az). 


Pos definición de T7* se tiene que 


Br; = (T*a;¡Jas) 
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Ejemplo 17. Sea Y un espacio producto interno de dimensión finita y 
E la proyección ortogonal de V sobre un subespacio W. Entonces para los vec- 
tores a y f cualesquiera en Y. 


(Ealf) = (Eq|EB + (1 — E)6) 
= (Ea|E6) 
= (Ea + (1 — Eja|E6) 
= (a| Ef). 


De la unicidad del operador E* se sigue que E* = E. Ahora considérese la 
proyección: E descrita en el Ejemplo 14. Entonces 


1 9 36  —3 
Á => | 36 144 -—12 
154 =3 -—12 1 


es la matriz de E en la base ortonormal canónica. Como E = E*_ A es tam- 
bién la matriz de £*, y como A = A* esto no contradice el corolario anterior. 
Por otro lado, supóngase que 

a = (154, O, 0) 

os = (145, —36, 3) 

az = (—36, 10, 12). 
Entonces (a,, %z, %,) es una base, y 


Eo = (9, 36, —3) 

Easz = (0, O, 0) 

Eaz = (0, O, 0). 
Como (9, 36, —3) = —(154, 0, 0) — (145, —36, 2), la matriz B de E en la base 
(01, 0%, %,) está definida por la expresión: 


-=1 00 
B=|-1 0 0|l 
0050 


En este caso B + B* y B* no es la matriz de E* = E en la base (a,, %a, %3). 
Aplicando el corolario, se concluye que (%,, %,, 3) no es una base ortonormal. 
Esto es bastante obvio naturalmente. 


Definición. Sea T un operador lineal sobre un espacio producto interno V. 
Entonces se dice que T tiene un adjunto sobre V si existe un operador lineal T* 
sobre V tal que (Ta|B) = (a|T*fB) para todo a y B en V. 


Por el Teorema 7 todo operador lineal en un espacio con producto interno 
de dimensión finita V tiene un adjunto en V. En el caso de dimensión infinita, 
esto no es siempre cierto. Pero, en todo caso, existe a lo más un tal operador T*; 
cuando existe se le llama el adjunto de 7. 

Dos comentarios respecto al casó de dimensión finita. 


1. El adjunto de T depende no solo de T, sino también del producto 
interno. 
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2. Como su vio en el Ejemplo 17, en una base ordenada arbitraria GB, la 
relación entre [7 ]g y [7*]g es más complicada que la dada en el corolario 
«Anterior. 


Ejemplo 18. Sea V = C"*! el espacio de las matrices complejas n x 1 
con el producto interno (Y| Y) = Y*X. Si A es una matriz n x n con elemen- 
tos complejos, el adjunto del operador lineal Y — AX es el operador X— A*X. 
lin efecto, 

(AX|Y) = Y*AX = (A*P)*X = (X|4*Y). 


1:1 lector debe convencerse por sí mismo de que esto es realmente un caso es- 
pecial del último corolario. 


Ejemplo 19. Este es semejante al Ejemplo 18. Sea Y = C"*” con el pro- 
ducto interno (4|B) = tr (B* 4). Sea M una matriz n x n dada sobre C. El 
adjunto de la multiplicación a la izquierda por M es multiplicación a la izq:uu:ex- 
da por M*. Naturalmente, «multiplicación a la izquierda por M» es el ope- 
rador lineal Ly definido por Ly(4) = MA. 

(Lu(A)1B) = tr (BHMA)) 
= tr (MAB*) 
= tr (AB*M) 
= tr (A(M*B)*) 
= (AlLu*(B)). 


Así (Ly)* = Lu». En el cálculo anterior se usó dos veces la propiedad carac- 
terística de la función traza: tr (4B) = tr (BA). 


Ejemplo 20. Sea V el espacio de los polinomios sobre el cuerpo de los nú- 
meros complejos con el producto interno 


(fla) = f fOJ0 dt. 


Si f es un polinomio f = E a,x*, se hace f = E á,x*. Esto es, f es el polino- 
mio cuya función polinomio asociada es la compleja conjugada de la de f: 


oO =f0, — treal 
Se considera el operador «multiplicación por f», esto es, el operador lineal 
M, definido por (M,Mg) = /g. Entonces este operador tiene un adjunto, a 
saber, multiplicación por f. En efecto, 


(UDI) = (Sal) 
= [SOLD de 


= [o oO IRONO] de 


= (gl fh) 
= (g|M5(h)) 


y asi (M3)* = M,. 
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Ejemplo 21. En el Ejemplo 20 se vio que algunos operadores en un espacio 
producto interno de dimensión infinita tiene un adjunto. Como se comentó 
anteriormente, otros no lo tienen. Sea V el espacio con producto interno del 
Ejemplo 20 y sea D el operador derivación en C[x]. Integrando por partes 
se tiene que 


MÍ) = Mg) — F(0)9(0) — (f|Dg). 


Se considera g fijo y se pregunta: ¿Cuándo existe un polinomio D*g tal que 
(Dflg) = (f1D*g) para todo f? Si tal D*g existe, se debe tener que 


($1D*) = FMg() — FOJ9(0) — (F|Dg) 


(F1D*g + Dg) = FUDg() — F(0)g(0). 


Con g fijo, Ef) = f(1)g(1) — f(0)2(0) es un funcional lineal del tipo consi- 
derado en el Ejemplo 16 y no puede ser de la forma L(f) = (F]A) a menos que 
L =0. Si D*g existe, entonces con h = D*g + Dg se tiene que L(f) = (£lA); 
por tanto, g(0) = g(1) = 0. La existencia de un polinomio apropiado D*g 
implica g(0) = g(1) = 0. Recíiprocamente, si g(0) = g(1) = 0, el polinomio 
D*g = —Dg satisface (Dflg) = Y |D*g) para todo f. Si se elige cualquier g 
para el que g(0) 4 0 o g(1) + 0, no se puede definir propiamente D*g, con 
lo que se concluye que D na tiene adjunto. 

Se espera que estos ejemplos aclaren la comprensión de lo que es el adjun- 
to de un operador lineal. Se ve que la operación adjunta, que pasa de Ta T*, 
se comporta en forma un tanto semejante a la conjugación de números comple- 
jos. El siguiente teorema refuerza esta analogía. 


Teorema 9. Sea V un espacio producto interno de dimensión finita. Si T y 
U som operadores lineales sobre V y c es un escalar 


(1) (7 + UY = T* + U*; 
(1) (CT =CT*; 
(11) (TU) = UF*T*; 
(iv) (T7*y* = T. 
Demostración. Para demostrar (1), sean a y $ vectores en V. Entonces 


((T + U)al8) = (Ta + Ual6) 
= (TalB) + (Ual6) 
= (a|T*8) + (aJU*B) 
= (a|T*p + U*B) 
= (al(T* 4 U*B). 


De la unicidad del adjunto se tiene que (7 + U)* = T* +4 U*. Se deja la de- 
mostración de (1) al lector. De las relaciones 


(TUal8) = (UalT*8) = (aJU*T*B) 
(T*o(p) = (BIT*a) = (Téla) = (alT8). HP 


se obtienen (i11) y (iv). ] 
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1-1 Teorema 9 se enuncia a menudo como sigue: la aplicación T— T* es 
itiisomorfa lincal-conjugada de periodo 2. La analogía con la conjugación 
compleja, que se ha mencionado anteriormente, está por cierto basada en la 
ubservación de que la conjugación compleja tiene las propiedades (z, + z,) = 
“1 = Za, (2,22) = 23,22, 2 = z. Se debe ser cuidadoso y observar la inversión 
del orden en el producto que impone la operación adjunta: (UTY* = T*U*. 
Cuando se continúe con el estudio de los operadores lineales en un espacio 
producto interno, se ampliará más esta analogía. En estas líneas algo diremos 
«l respecto. Un número complejo z es real si, y solo si, z = Z. Se podría esperar 
que el operador lineal 7 tal que T = T* se comporte en forma semejante a 
los números reales. En efecto, es así. Por ejemplo, si 7 es un operador lineal 
sobre un espacio complejo producto interno de dimensión finita, entonces 


(8-15) T = U, +10» 


donde U, = UF y U, = UF. Así, en cierto sentido, T tiene una «parte real» 
y una «parte imaginaria». Los operadores U, y U, que satisfacen U, = Uf 
y U, = Uf, y (8-15) son únicos y están dados por 


OU, =— ¿1 + T*) 





1 


Un operador lineal 7 tal que T = 7* se llama autoadjunto (o hermítico). 
Si (3 es una base ortonormal de Y, entonces 


[7*la = [716 


y así T es autoadjunto si, y solo si, su matriz en toda base ortonormal es una 
matriz autoadjunta. Los operadores autoadjuntos son importantes, no sola- 
mente porque suministran una especie de parte real y parte imaginaria para 
cl operador general, sino también porque: (1) Los operadores autoadjuntos 
ticnen muchas propiedades especiales. Por ejemplo, para un operador así, existe 
una base ortonormal de vectores propios. (2) Muchos operadores que surgen 
cn la práctica son autoadjuntos. Las propiedades especiales de los operadores 
«utoadjuntos se considerarán más adelante. 


Ejercicios 
l. Sea Y el espacio C? dotado del producto interno canónico. Sea T el operador lineal 
definido por Te, = (1. 2), Te, = (¿. --1). Si 9 = (x,, x2), hallar 7*%ua. 


2. Sca T el operador lineal en C? definido por Te, = (1 + i, 2), Te, = (i, ¿). Usando el 
producto interno canónico, hallar la matriz de 7* en la base ordenada canónica. ¿Conmuta 
F con T*? 
» Seca V = C? con el producto interno canónico. Sea T el operador lineal sobre V cuya 
muttriz en la base ordenada canónica está definida por 

Ay = vt, (1? = —1). 


Hallar una base para el espacio nulo de 7*. 
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4. Sean V un espacio producto interno de dimensión finita y 7 un operador lineal sobre 
Y. Demostrar que la imagen por 7* es el complemento ortogonal del espacio nulo de 7. 


5. Sean V un espacio producto interno de dimensión finita y 7' un operador Jineal sobre 
V. Si T es inversible, demostrar que T7* es inversible y que (7*)7* = (77 *y*. 


6. Sean V un espacio producto interno y $, y vectores dados de V. Demostrar que Ta = 
(a ]P)y define un operador lineal sobre Y. Demostrar que T tiene un adjunto y dar explici- 
tamente T7*. 

Supóngase ahora que Y = C” con el producto interno canónico f = (y,, ..., Yn) y 
y = (Xi, .. . , Xn). ¿Cuál es el elemento j, k de la matriz de T en la base ordenada canónica? 
¿Cuál es el rango de esta matriz? 


7. Demostrar que el producto de dos operadores autoadjuntos es autoadjunto si, y solo si, 
los dos operadores conmutan. 


8. Sea Y el espacio vectorial de los polinomios sobre R de grado menor o igual que 3 con 
el producto interno 


(Hg) = Í: 040 de. 


Si r es un número real, hallar el polinomio g, de V tal que (f|g,) = f(t) para todo f de V. 


9. Sea V el espacio producto interno del Ejercicio 8 y sea D el operador derivación sobre 
V. Hallar D*. 


10. Sea Y el espacio de las matrices n x n sobre los números complejos con el producto 
interno (4|B) = tr (4B*). Sea P una matriz dada en V, inversible, y sea Tp el operador 
lineal sobre V definido por Tp(4) = P7* AP. Hallar el adjunto de Tp. 


1M. Sea Y un espacio producto interno de dimensión finita y sea E un operador lineal 
idempotente sobre V; es decir, E? = E. Demostrar que E es autoadjunto si, y solo si, 
EE* = E*E. 


12. Sea V un espacio producto interno complejo de dimensión finita y sea T un operador 
lineal sobre V. Demostrar que T es autoadjunto si, y solo si, (Toja) es real para todo 
a de Y. 


5.4. Operadores unitarios 


En esta sección se considerará el concepto de un isomorfismo entre dos 
espacios producto interno. Si Y y W son espacios vectoriales, un isomorfismo 
de V sobre W es una transformación lineal inyectiva de Y sobre W; es decir, 
una correspondencia biunivoca entre los elementos de V y de W que «preser- 
van» las operaciones de espacio vectorial. Ahora bien, un espacio producto” 
interno consiste en un espacio vectorial y un producto - interno definido sobre 
dicho espacio. Así, pues, cuando Y y W son espacios producto interno, se exi- 
girá de un isomorfismo de V sobre W no solo que preserve las operaciones linea- 
les, sino que también preserve el producto interno. Un isomorfismo de un es- 
pacio producto interno sobre sí mismo se llama «operador unitario» sobre 
ese espacio. Se considerarán varios ejemplos de operadores unitarios y se esta- 
blecerán sus propiedades básicas. 
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Definición. Scan V y W espacios producto interno sobre el mismo cuerpo 
y sca T una transformación lineal de V en W. Se dice que T preserva productos 
internos si (7a|Tf) = («|fB) para todo a, $ de V. Un isomorfismo de V sobre W es 
un isomorfismo T de espacio vectorial de V sobre W que también preserva pro- 
ductos internos. 


Si T preserva productos internos, entonces ||Tu|| = lla ]| y así T es necesa- 
riimente no singular. Así que un isomorfismo de Y sobre W puede ser definido 
también como una transformación lineal de V sobre W que preserva productos 
internos. Si 7 es un isomorfismo de Y sobre W, entonces T”* es un isomorfismo 
de W sobre V; luego, cuando tal T' existe, se dirá simplemente que Y y W son 
isomorfos. Naturalmente, el isomorfo de espacio producto interno es una re- 
lación de equivalencia. 


Teorema 10. Sean V y W espacios producto interno de dimensión finita 
sobre el mismo cuerpo y que tienen la misma dimensión. Si T es una transforma- 
ción lineal de V en W, las siguientes afirmaciones som equivalentes. 


(1) T preserva los productos internos. 

(1) T es un isomorfismo len un espacio producto interno). 
(ii) 7 aplica toda base ortonormal de V sobre una base ortonormal de W. 
(iv) T aplica cierta base ortonormal de V sobre una base ortonormal de W. 


Demostración. (i) —> (11). Si 7 preserva los productos internos, entonces 
||Ta)| = Jjo]] para todo a de V. Así, T es no singular, y como dim Y = dim W, 
se sabe que T' es un isomorfismo de espacio vectorial. 

(1i) => (ii). Supóngase que T sea un isomorfismo. Sea ([x,,..., 0,) una base 
ortonormal de V. Como T es un isomorfismo de espacio vectorial y dim W = 
dim V, se sigue que (Ta,, ..., Ta, j es una base de W. Como T también pre- 
serva los productos internos, (Ta,|Ta,) = (0;lo,) = 6. 

(111) — (1v). Esta no requiere comentario. 

(iv) > (i). Sea [a,,..., a, y una base ortonormal de V tal que (Tx,,..., 70) 
sea una base ortonormal de W. Entonces 


(Taj Tar) = (ajlar) = Sjx. 
Para cualquier % = x,%, + *** + Xxp%, Y B = Y¡%, + *:* + y,%, de V, tenemos 
(alf8) = z 258; 
j= 


(Ta|TB) = (2 x,Ta,| z Y: T ax) 
3 


2 2 xi YT a¡¡Tas) 


j 
n Cad 
= 2 254; 
j=1 


y así, pues, T' preserva los productos internos. |] 
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Corolario. Sean V y W espacios producto interno de dimensión finita sobre 
el mismo cuerpo. Entonces V y W son isomorfos si, y solo si. tienen la misma di- 
mensión. 


Demostración. Sifa,,....0,y es una base ortonormal de V y [£,, ...., Ph) 
es una base ortonormal de W,, sea T la transformación lineal de V en W defini- 
da por Ta; = f;¡. Entonces T es un isomorfismo de V sobre W. | 


Ejemplo 22. Si V es un espacio producto interno de dimensión finita, 
entonces cada base ordenada ortonormal (Bf = (fa,, ..., 0%,) determina un 
isomorfismo de V sobre F” con el producto interno canónico. El isomorfismo 
no es más que 


T(z,a1 + ... + Tn An) = (Za, ...) Ln). 


Existe el isomorfismo, aparentemente distinto, que (3 determina de V sobre 
el espacio F"** con (X| Y) = Y*X como producto interno. El isomorfismo es 


a —> [a la 


es decir, la transformación que aplica « en su matriz de coordenadas en la base 
ordenada (3. Para cualquier base (3, éste es un isomorfismo del espacio vec- 
torial; sin embargo, es un isomorfismo de los dos espacios con producto inter- 
no si. y solo si, es ortogonal. 


Ejemplo 23. Aqui se presenta un Isomorfismo algo menos superficial. Sea 
W el espacio de todas las matrices 3 x 3, A, sobre R antisimétricas, es decir, 
A' = —A.Se dota a W del producto interno (4]|B) = 5 tr (4B"): el 5 es por mera 
conveniencia. Sea V el espacio R? con el producto interno cañónico. Sea T una 
transformación lineal de Y en W definida por 


0 — X3 Lo 
Tx, L2, X3) =_ XL3 0 — Tr | 
— Lo í1 O. 


Entonces T' aplica Y sobre W, y haciendo 


0 —X3 Za 0 — Y3 Ya 
A = T3 O —zajb B = Ya O —y 
— To YI 0 — Ya Y1 0 


tenemos 


tr (ABO = 2343 + 22Y2 + TaYa + Toya + 21Yl 
- 2(1141 —+ L2Y2 + X3Y3). 


Así, pues, (a]f) = (Ta| TB) y T es un isomorfismo de espacio vectorial. Obsér- 
vese que T aplica la base canónica fe,, €,, €,) sobre la base ortonormal que consta 
de las tres matrices 


00 0 0 0 1 0 —1 0 


0.0 —I|b 0 0 Ob 1 0 0t 
01 0 -1 050 0. 050 
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ljemplo 24. No siempre es particularmente conveniente describir un 1so- 
meorhsmo en terminos de las bases ortonormales. Por ejemplo, supóngase que 


. + P*P, donde P es una matriz n x n, imversible, con elementos complejos. 
Ma P el espacio de las matrices complejas n x 1 con el producto interno 
11)» ] = F*GX. Sea W el mismo espacio vectorial, con el producto inter- 


mo vanónico (X| Y) = Y*X. Se sabe que V y W son espacios producto interno 
rmorfos. Pareceria que el modo más conveniente de dar un isomorfismo 
entre Y y W es el siguiente: sea T la transformación lineal de Y en W definida 
por MX) = PX. Entonces 


(TX|TY) = (PX|PY) 
(PY)(PX) 
Y*P*PX 
Y*GX 
[X|Y]. 


l 


luego T es un isomorfismo. 


I:jemplo 25. Sea V el espacio de todas las funciones continuas de valor 
val en el intervalo unitario O < £ < 1, con el producto interno 


[fig] = IN FOYW0e dt. 


Sca MY el mismo espacio vectorial con el producto interno 
l 
1 = [5090 a. 


Seca T la transformación lineal de Y en W dada por 
TN = 40. 


lntonces (7f|Tg) = Lf 2), y así T preserva los productos internos; sin em- 
bargo, 7 no es un isomorfismo de V sobre W, ya que la imagen de T'no es todo W. 
Por supuesto, esto sucede porque el espacio vectorial básico no es de dimen- 
sión finita. 


Teorema 11. Sean V y W espacios producto interno sobre el mismo cuerpo 
v sea T una transformación lineal de V en W. Entonces T preserva productos in- 
ternos si, y solo si, ||Ta|| = llull para todo a en V. 


Demostración. Si T preserva productos internos, entonces T «preserva 
normas». Supóngase que ||Ta|; = |ja]| para todo a de Y. Entonces |¡Ta]|? = |Jod]!?. 
Ahora. usando la identidad de polarización apropiada, (8-3) o (8-4), y el hecho 
de que T es lineal, se obtiene fácilmente que (x|f) = (Tal Tf) para todo a, f 
en V |] 


Definición. Un operador unitario en un espacio producto interno es un iso- 
morfismo del espacio sobre sí mismo. 


El producto de dos operadores unitarios es unitario. En efecto, si U, y U, 


XM) Alechbra lincal 


> 


son unitarios, entonces U,U, es inversible y ||U¿U,a)] = ||U,al| = |la])- para 
cada a. También el inverso del operador unitario es unitario, ya que ||Ua|| = lla], 
dice que |JU”*Bl| = ||Pl|, donde fP = Ua. Dado que el operador unitario es 


evidentemente unitario, se ve que el conjunto de todos los operadores unitarios 
en un espacio producto interno es un grupo para la operación de composición. 

Si V es un espacio producto interno y U es un operador lineal sobre V, el 
Teorema 10 dice que U es unitario si, y solo si, (Ux|UB) = (a|8) para todo 
a, B de V; o si, y solo si, para cierta (toda) base ortonormal (x,, ..., 0, y es cierto 
que:fUa,, ..., Ua,) es una base ortonormal. 


Teorema 12. Sea U un operador lineal sobre un espacio producto inter- 
no V. Entonces U es unitario si, y solo si, el adjunto U* de U existe y UU* = 
U*U =I1 


Demostración. Supóngase que U es unitario. Entonces U es inversible y 
(Ua]é) = (Ua|UU”!8) = (a]U=18) 


para todo a, ff. Luego U”* es el adjunto de U. 

Reciprocamente, supóngase que existe U* y que UU* = U*U = [. Enton- 
ces U es inversible, con UT* = U*. De modo que solo se necesita demostrar 
que U preserva productos internos. Tenemos que. 


(Uoa|UB) = (afU*UE) 
= (0/18) 
= (a(8) 
para todo a, f. |] 


Ejemplo 26. Consideremos C”** con el producto interno (X] Y) = Y*X. 
Sea Á una matriz n x n sobre C, y sea U el operador lineal definido por U(X) = 
AX. Entonces 


(UXJUY) = (AX|AY) = Y*A*AX 


para todo X, Y. Luego U es unitario si. y solo si, AYA = I. 
Definición. Una matriz compleja n x n, A, se llama unitaria si AYA = 1. 


Teorema 13." Sea V un espacio producto interno de dimensión finita y sea 
U un operador lineal sobre V. Entonces U es unitario si, y solo si, la matriz de U en 
alguna (o toda) base ordenada ortonormal es una matriz unitaria. 


Demostración. A esta altura, esto casi no es un teorema, y se formuló más 
que todo por insistir. Si 6 = [x,, ..., 0, ) es una base ordenada ortonormal 
de V y A es la matriz de U respecto de (3, entonces A*A = [si, y solo si, U*U= TI. 
El resultado se desprende ahora del Teorema 12. |] 


Sea Á una matriz n x n. La afirmación de que A es unitaria solo quiere 
decir que 
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(AFA Dix = Óju 
O 


2 Ar Ark — Ok. 


En otras palabras, esto significa que las columnas de A forman un conjunto 
ortonormal de matrices columna con respecto al producto interno canónico 
(X/Y) = Y*X. Como A*A = Isi, y solo si, AÁ* = ], vemos que A es unitaria 
exactamente cuando las filas de A constituyen un conjunto ortonormal de n-tuples 
de C, (con el producto interno canónico). Así, usando los productos internos 
canónicos, Á es unitaria si, y solo si, las filas y las columnas de A son conjuntos 
ortonormales. Se ve aquí un ejemplo del poder del teorema que establece que 
una inversa latéral (a un lado) para una matriz es inversa a ambos lados. Apli- 
cando este teorema como se hizo anteriormente, por ejemplo, a matrices reales, 
tenemos lo siguiente: supóngase que tenemos un arreglo en cuadro de números 
reales tales que la suma de los cuadrados de los elementos de cada fila es 1 y las 
filas distintas son ortogonales. Entonces, la suma de los cuadrados de los ele- 
mentos de cada columna es 1 y las columnas distintas son ortogonales. Escrí- 
base la demostración de esto para un arreglo de 3 x 3 sin usar lo que se conoce 
de las matrices y se quedará bastante impresionado. 


Definición. Una matriz n x n real o compleja, A, se dice ortogonal si A*A= 1 


Una matriz ortogonal real es unitaria, y una matriz unitaria es ortogonal 
si, y solo si, cada uno de sus elementos es real. 


Ejemplo 27. Damos algunos ejemplos de matrices unitarias y ortogonales. 


(a) Ases la matriz 1] x l, c, es ortogonal si, y solo si, c = +1, y es unitaria 
si, y solo si, dc = 1. La última condición quiere decir (naturalmente) que |c| = 1, 
o c = e'?, donde 0 es real. 

(b) Sea 


a b 
a=|; dj 


Entonces A es ortogonal si, y solo si, 


4t= aro 1 | d ll 


_ad=bcl=e a 


El determinante de una matriz ortogonal es, como fácilmente se ve, +1. Así 
Á es ortogonal si, y solo si, 
a b 
4 = L; o) 


a b 
4 = l; La) 
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donde a? + b? = 1. Los dos casos se distinguen por el valor de det A. 
(c) Las relaciones, bien conocidas, entre funciones trigonométricas mues- 


tran que la matriz 
cos) sen 0 
de = Dd cos O | 


es ortogonal. Sj 6 es un número real, entonces Ag es la matriz en la base orde- 
nada canónica de R? del operador lineal U,, rotación de ángulo 6. La afirmación 
de que Ag es una matriz ortogonal real (por tanto unitaria) solo quiere decir 
que U, es un operador unitario, es decir, preserva productos escalares. 


(d) Sea 
a b 
Á= h d 


Entonces Á es unitaria si, y solo si, 


E 1 = 1 | d mi 

b d ad=bel=e a 

El determinante de una matriz unitaria tiene valor absoluto 1 y es, por tanto, 
un número complejo de la forma e*?, 6 real. Así A es unitaria si, y solo si, 


A = o ¿20 > lo do | 5 e) 


donde 0 es un número real, y a, b son números complejos tales que Ja]? + |b|?=1. 


Como se observó antes, los operadores unitarios sobre un espacio produc- 
to interno forman un grupo. De esto y del Teorema 13 se sigue que el conjunto 
U(n) de todas las matrices unitarias n x n es también un grupo. Así la inversa 
de una matriz unitaria y el producto de dos matrices unitarias son también 
matrices unitarias. Por cierto. esto es fácil verlo directamente. Una matriz 
n x n, A, con elementos complejos es unitaria si, y solo si, A7* = A*. Asi, 
si A es unitaria, tenemos que (4A7*)* = A = (4A*) * = (47 *)*. Si A y B son 
matrices unitarias n x n, entonces (AB)? = B7*4"* = B*A* = (AB)*. 

El proceso de Gram-Schmidt en (” tiene un corolario interesante para las 
matrices en que entra el grupo U(n). 


Teorema 14. Para toda matriz compleja n x n, inversible, B, existe una úni- 
ca matriz triangular inferior M, con elementos positivos en la diagonal principal, 
de modo que MB es unitaria. 


Demostración. Las filas ff,, ..., B, de B forman una base de C”. Sean 
O, . - - , % los vectores que se obtienen de f,, ..., f, por el proceso de Gram- 
Schmidt. Entonces, para 1 <k <n, [d;, ..., %,) es una base ortogonal del 
subespacio generado por ([fB,, ..., Bi). y 


0 =P 2 (Belo) 


¿<e llaj[2 
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luego, para todo k, existen escalares únicos C,, tales que 
0 = Pi— 2 Cubs. 
j<k 


Sca U la matriz unitaria con filas 
1851 An 


lla]? " "7? for]! 








y M la matriz definida por 





1 . 
edi Cri siz<xk 
Mv; = 1 A 
llar $1=% 
0, si¿j>k. 


Entonces M es triangular inferior, ya que sus elementos sobre la diagonal prin- 
cipal son 0. Los elementos M,, de M, de la diagonal principal, son todos >0, y 


Ok 

loz] 

Ahora estas igualdades simplemente dicen que 
U = MB. 


Para demostrar la unicidad de M, sea T* (n) el conjunto de todas las matrices 
complejas n x n triangulares, inferiores con elementos positivos en la diagonal 
principal. Supóngase que M, y M, sean elementos de M* (n) tales que M,B 
está en U(n) para i¡ = 1, 2. Entonces, por ser U(n) un grupo 


(MB MB)” = M¡M7 y 





e Z MiB  1<Sk<n. 
j= 


está en U(n). Por otro lado, aurí cuando no es enteramente obvio, T* (n) es tam- 
bién un grupo para la multiplicación matricial Un modo de verlo es consi- 
derar las propiedades geométricas de las transformaciones lineales 


X>MX, (M en T+(n)) 


sobre el espacio de las matrices columnas. Así M;*, M,M;? y (M,M)5?y"' 
están todas en T*(n). Pero, como M¡M,? está en U(n), (M,M;'!y! = 
(M,M>')*. La transpuesta o la conjugada transpuesta de cualquier matriz 
triangular inferior es una matriz triangular superior. Por tanto, M,M;' es 
simultáneamente triangular superior e inferior, es decir, diagonal. Una matriz 
diagonal es unitaria si. y solo si, cada uno de sus elementos de la diagonal prin- 
cipal tiene valor absoluto 1; si los elementos de la diagonal son todos positivos, 
deben ser iguales a 1. Luego M,M,* =T[, con lo que M, = M,. | 


Sea GL(n) el conjunto de todas las matrices complejas n x n e inversibles. 
Entonces GL(n) es también un grupo para la multiplicación matricial. Est2 
grupo. se llama el grupo lineal general. El Teorema 14 es equivalente al siguien- 
te resultado. 
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Corolario. Para toda B de GL(), existen matrices únicas N y U tales que 
N está en T*(n), U en Uln), y 


B=N-:U, 


Demostración. Por el teorema existe una matriz única M en T*(n) tal 
que MB está en U(n). Sea MB = U y N = M”7?, Entonces N está en T'*(n) 
y B= N-:U,. Por otro lado, si se dan elementos N y U cualesquiera tales que 
ÑN está en T* (1), U está en U(n) y B = N : U, entonces N7*B está en U(n) y N7* 
es la única matriz M que está caracterizada por el teorema. Además U es ne- 
cesariamente N7'*B. | 


Ejemplo 28. Sean x, y x, números reales tales que x? + x2= 1 yx, 40. 


Sea 
a zz 0 
B=|l0 1 0|4 
0 0 1 
Aplicando el proceso de Gram-Schmidt a las filas de B, se obtienen los vectores 


01 = (21, 2, 0) 

a = (0, 1, 0) —> xa (Tr, La, 0) 
= 2(—z», ra, 0) 

Ag = (0, O, 1). 


Sea U la matriz con filas a,, (a,/x,), a,. Entonces U es unitaria. y 


zx Tte O 1.0 0OTfFx z. 0 

U=l-ws m ol=1-2 2 ollo 1 0 
X1 Ti 

0 0 1 0 0 15/N0 O 1 


Ahora, multiplicando por la inversa de 


10.0 
m=|-2 0 
Ti Ti 
0 0 1 


se tiene que 


Tr Ta 0 1 0 0 T1 Toa 0 
O 1 Ol=lzx 2% 0Oll—x. 2, O 
0 O 1 0 O 1 0 0 1 


Consideremos ahora brevemente el cambio de coordenadas en un espacio 
producto interno. Supóngase que Y es un espacio producto interno de dimen- 
sión finita, y que GB = fa,,...,0,) y B6' = [aj, ..., a,) son dos bases orde- 
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nadas ortonormales de V. Existe una única matriz n x n (necesariamente in- 
versible), P, tal que 


[aja = P Hole 


para todo a en V. Si U es el operador lineal único sobre Y definido por Ua, = a;, 
entonces P es la matriz de U en la base ordenada GB; 


n 
) 
a = 2 Pia. 
j=1 “> 


Como GH y (G3' son bases ortonormales, U es un operador unitario y P es una 
matriz unitaria. Si 7 es un operador lineal cualquiera sobre Y, entonces 


[Tla = PUT ]6P = P*[TIgP. 


Definición. Sean A y B matrices complejas n x nm. Se dice que B es unita- 
riamente equivalente a A si existe una matriz unitaria n x n, P, tal que B = P"* AP. 
Se dice que B es ortogonalmente equivalente a A si existe una matriz ortogonal 
n xn, P, tal quee B= P"*AP. 


Con esta definición, lo que se observó anteriormente puede enunciarse como 
sigue: si 63 y G3' son dos bases ordenadas ortonormales para V, entonces, para todo 
operador lineal 7 sobre V, la matriz [7 ]g es unitariamente equivalente a la 
matriz [7]. En el caso que Y sea un espacio producto interno real, estas ma- 
trices son ortogonalmente equivalentes a través de una matriz ortogonal real. 


Ejercicios 


1. Hallar una matriz unitaria que no sea ortogonal y encontrar una matriz ortogonal 
que no sea unitaria. 


2. Sea V el espacio de las matrices complejas n x n con producto interno (4|B) = tr (4B*). 
Para cada M en V, sea Ty, el operador lineal definido por Ty (A) = MA. Demostrar que 
Tu €es unitario si, y solo si, M es una matriz unitaria. 


3. Sea V el conjunto de los números complejos considerados como espacio vectorial real. 
(a) Demostrar que (a|f) = Re (af) define un producto interno sobre V. 
(b) Mostrar un isomorfismo (de espacio producto interno) de Y sobre R? con el pro- 
ducto interno canónico. 


(c) Para cada y de V, sea M, el operador lineal sobre V definido por M_(a) = ya. De- 
mostrar que (M,)* = M5. 

(d) ¿Para qué números complejos y es M, autoadjunto? 

(e) ¿Para cuáles y es M, unitario? 

(f) ¿Para cuáles y es M, positivo? 

(g) ¿Cuál es det (M,)? 

(h) Hallar la matriz de M, en la base (1, i). 

(1) Si T es un operador lineal en V, hallar condiciones necesarias y suficientes para T 
para que sea un M,. 

(3) Encontrar un operador unitario sobre V que no sea un M,. 
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4. Sea V = R? con el producto interno canónico. Si U es un operador unitario sobre |”, 
demostrar que la matriz de U cn la base ordenada canónica es 


ha 0 —senó pos 0  senó 
send cosó senÚ  —cos Ú 
para algún real 0, 0 < O < 2. Sea U, el operador lineal que corresponde a la primera ma- 
triz; es decir, U¿ es una rotación de ángulo 0. Ahora observar que todo operador unitario 
sobre Y es una rotación o una simetría en torno al eje <1 seguida de una rotación. 

(a) ¿Qué es U¿U¿? 

(b) Demostrar que U¿F = Us. 

(c) Sea d un número real fijo y sea KG = [a,, a) la base ortonornal obtenida por ro- 
tación de (€,, €,] en el ángulo $; es decir, a, = U¿e,. Si O es otro número real, ¿cuál es la 
matriz de U, en la base ordenada 03? 


5. Sea Y = R? con el producto interno canónico. Sea W el plano generado por a = (1. 1, 1) 
y B = (1, 1, —2). Sea U el operador lineal definido geométricamente como sigue: U es la 
rotación de ángulo Ó en torno a la recta que pasa por el origen ortogonal a W. En realidad 
hay dos de estas rotaciones —se elige una. Hallar la matriz de U en la base ordenada canó- 
nica. (He aquí un camino que se podría seguir: hallar que a, y a, forman una base ortonor- 
mal de W. Sea az un vector de norma 1 que es ortogonal a W. Hallar la matriz de U en la 
base (a,, %,, 03). Hágase un cambio de base.) 


6. Sea Y un espacio producto interno de dimensión finita y sea W un subespacio de V. 
Entonces V = WO W?, esto es, todo a de Y se expresa univocamente en la forma a.= fi + y, 
con f en W y y en W?, Se define un operador lineal U por Ua =' fi — y. 

(a) Demostrar que U es autoadjunto y unitario. 

(b) Si Y es R?, con el producto interno canónico, y W es el subespacio generado por 
(1, 0, 1), hallar la matriz de U en la base ordenada canónica. 


7. Sea V un espacio complejo con producto interno y T un operador lineal autoadjunto 
sobre V. Demostrar que 

(a) Ju + ¿Tal = llo — ¿Tol] para todo a en V. 

(b) a + ¡Ta = PB + ¡Tf sí, y solo si, a = fi. 

(c) [ + ¡T es no singular. 

(d) / — ¡T es no singular. 

(e) Supongamos ahora que V es de dimensión finita y demostremos que 

U =(I —- iD (1 +1iTy" 

es un operador unitario; U se llama la transformación de Cayley de 7. En cierto sentido 
U = [(T), donde fix) = (1 — xQ + ix). 


8. Si 0 es un número real, demostrar que las siguientes matrices son equivalentes uni- 


tariamente 
pe —sen o) e 07 
sen 0 cos O | O e€*% 


9. Sean Y un espacio producto interno de dimensión finita y 7 un operador lineal posi- 
tivo sobre V. Sea pz el producto interno sobre Y definido por py(a, $) = (Ta, fi). Sea U un 
operador lineal en V y U* su adjunto con respecto a ( | ). Demostrar que U es unitario 
con respecto al producto interno pr si, y solo si, 7 = U*TU. 
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10. Seca Y un espacio producto interno de dimensión finita. Para cada a, f en V, sea Tr y 
el operador lineal en Y definido por T, ¿() = (y|f)a. Demostrar que 

la) Tép = Tra: 

(b) traza (To ¿) = (0]f). 

) TasTo.s = Taipiyo: 

(4) ¿En qué condiciones es T; ¿ autoadjunto? 


1. Sca V un espacio producto interno de dimensión finita sobre el cuerpo F y sea L(V, V) 
el espacio de los operadores lineales sobre Y. Demostrar que existe un producto interno 
unico sobre L(V, V) con la propiedad de que ||7, ¿|? = ||aj|?]]8]]? para todo a, f de Y 
(f, p es el operador definido en el Ejercicio 10). Hallar un isomorfismo entre L(V, V), con 
este producto interno, y el espacio de las matrices n x n sobre F, con el producto interno 
( 1|B) = tr (4B*). 


12. Sea V un espacio producto interno de dimensión finita. En el Ejercicio 6 mostramos 
como construir operadores lineales sobre Y que son autoadjuntos y unitarios a la vez. De- 
mostrar ahora que no hay otros, es decir, que todo operador autoadjunto y unitario surge 
«de cierto subespacio W como se describió en el Ejercicio 6. 


13 Sean V y W espacios producto interno de dimensión finitá que tienen la misma di- 
mensitón. Sea U un isomorfismo de Y sobre W. Demostrar que 

(a) La aplicación 7-— UTU”* es un isomorfismo del espacio vectorial L(V, Y) sobre 
cl espacio vectorial L(W, W). 

(b) traza (UTU"?*) = traza (T) para todo T de L(V, V). 

(c) UT, ¿U*= Tue ug (Ta. p definido en el Ejercicio 10). 

(d) (UTU”"*y* = UT*U! 

(e) Si se dota L(V. V') del producto interno (7,|7,) = traza (7,77), y análogamente 
para L(W, W), entonces T—= UTU”* es un isomorfismo de espacios producto interno. 


14. Si V es un espacio producto interno, un movimiento rigido es cierta función T de V en 
! (no necesariamente lineal) tal que ||To — Tfl| = ju — fl] para todo a, f de Y. Ejemplo 
de movimiento rigido es un operador lineal unitario. Otro ejemplo es la traslación de vec- 
tor dado y: 


T (0) = a+ y 


(a) Sea Y — R?, con el producto interno canónico. Supóngase que T es un movimiento 
rígido de V y que T(0) = 0. Demostrar que T es operador lineal y unitario. 

(b) Usar el resultado de la parte (a) para demostrar que todo movimiento rígido de 
R? está compuesto de una traslación, seguida de un operador unitario. 

(c) Demostrar ahora que un movimiento rígido de R? es una traslación seguida de 
una rotación. o una traslación seguida de una simetría seguida de una rotación. 


15. Un operador unitario sobre R* (dotado del producto interno canónico) es simplemen- 
te un operador lineal que preserva la forma cuadrática, 


Gx, y, 2, DI? = 132+ y24 2241 


esto es, un operador lineal U tal que ||Ua|]? = llu]]? para todo a de R*. En cierta parte de 
la teoría de la relatividad es de interés hallar los operadores lineales T que preservan la 
forma 


||Gz, Y, 2, 31164 = (2 q — y?— 22 


Pero aquí || ||Z no proviene de un producto interno, sino de algo llamado la «métrica de 
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Lorentz» (en la que no entraremos). Por esa razón un operador lincal 7 sobre R* tal que 
[[Tallh = lul]h, para todo a de R*, se llama transformación de Lorentz. 
(a) Demostrar que la función U definida por 


ti+a y+z 

Ue z0=|, 3 Es] 
es un isomorfismo de R* sobre el espacio vectorial real H de las matrices complejas 2 x 2 
autoadjuntas. 

(b) Demostrar que [la]? = det (Ux.). 

(c) Supóngase que T es un operador lineal (real) sobre el espacio H de las matrices 
2 x 2 autoadjuntas. Demostrar que L = U"'*TU es un operador lineal sobre R*?. 

(d) Sea M una matriz compleja 2 x 2 cualquiera. Mostrar que Ty(4) = M*AM de- 
fine un operador lineal 7,, sobre H (asegurarse de que 7,, aplica H en H). 

(e) Si M es una matriz 2 x 2 tal que [det M| = 1, demostrar que £y = U” *TyU es 
una transformación de Lorentz en R*. 

(£) Hallar una transformación de Lorentz que no sea un £yy. 


8.5. Operadores normales 


El objetivo principal de esta sección es la solución del siguiente problema. 
Si T es un operador lineal sobre un espacio producto interno de dimensión 
finita V, ¿en qué condiciones tiene Y una base ortonormal formada por vec- 
tores propios de 7? En otras palabras, ¿cuándo existe una base ortonormal GB 
de V, tal que la matriz de T en la base (GH sea diagonal? 

Comenzaremos deduciendo unas condiciones necesarias para T, que más 
adelante se verá que son suficientes. Supongamos que Gh = (a,, ..., 0,) es 
una base ortonormal de V con la propiedad 


(8-16) Ta; = CjQAj, 3 = 1, ...yN. 


Esto solo dice que la matriz de T en la base ordenada (3 es la matriz diagonal 
con elementos C,, ..., €, en la diagonal. El operador adjunto T* está repre- 
sentado en esta misma base ordenada por la matriz transpuesta conjugada; 
es decir, la matriz diagonal con elementos C,, ..., €, en la diagonal. Si V es un 
espacio producto interno real, los escalares c,, ..., c, son (claro está) reales 
y, por tanto, debe tenerse que T = T'*. En otras palabras, si Y es un espacio 
producto interno real de dimensión finita y T es un operador lineal para el que 
existe una base ortonormal de vectores propios, entonces T debe ser autoadjunto. 
Si V es un espacio producto interno complejo, los escalares C,, ..., C, no ne- 
cesitan ser reales; es decir, T no necesita ser autoadjunto. Pero obsérvese que 
T debe satisfacer 


(8-17) TT* = T*T. 


En efecto, dos matrices diagonales cualesquiera conmutan, y como T y T* 
están ambos representados por matrices diagonales en la base ordenada GB. 
se tiene (8-17). Es más bien notable que, en el caso complejo. esta condición 
sea también suficiente para implicar la existencia de una base ortonormal de 
vectores propios. 
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Definición. Sean V un espacio producto interno de dimensión finita y T un 
operador lineal sobre V. Se dice que T es normal sí conmuta con su adjunto; es 
decir, TT* = T*T 


Todo operador autoadjunto es normal, como también todo operador uni- 
turio; sin embargo, las sumas y productos de operadores normales no son en 
peneral normales. Aunque no es necesario, comenzaremos el estudio de los 
uperadores normales considerando operadores autoadjuntos. 


Teorema 15, Sean V un espacio producto interno y T un operador lineal 
utitoudjunto sobre V. Entonces todo valor propio de T es real y los vectores propios 
de T, asociados a valores propios distintos, son ortogonales. 


Demostración. Supóngase que c es un valor propio de T'; es decir, que 
lx = ca para algún vector no nulo a. Entonces 
c(ala) = (cala) 
= (Tala) 
(a| Ta) 
(a|ca) 


Cala). 


Como (ala) + 0, debemos tener que c = €. Supóngase que también tenemos 
que 7f = df$ con f + 0. Entonces 


c(a|8) = (TalB) 
= (a|T8) 
= (aldg) 
= d(a|8) 
= d(o8). 


Si c % d, entonces (a|f) = 0. | 


Debe observarse que el Teorema 15 no dice nada respecto a la existencia 
de valores propios o de vectores propios. 


Teorema 16. En un espacio producto interno de dimensión finita y positi- 
ra todo operador autoudjunto tiene un vector propio (no nulo). 


Demostración. Sea Y un espacio producto interno de dimensión n, donde 
"n > 0, y sea T un operador autoadjunto en V, Se elige una base ortonormal 
($B para V y sea 4 = [T]g. Como T = T*, tenemos que A = A*. Ahora sea 
I el espacio de las matrices n x 1 sobre C, con el producto interno (X'| Y) = 
yY*X. Entonces U(X) = AX define un operador lineal autoadjunto U en W. 
I-l polinomio característico, det (x/ — 4), es un polinomio de grado n sobre 
los números complejos; todo polinomio sobre C de grado positivo tiene una 
raíz. Así existe un número complejo c tal que det (c/ — A) =.0. Esto quiere 
decir que A — cl es singular, o que existe un X distinto de cero tal que AX =cX. 
Como el operador U (multiplicación por 4) es autoadjunto, se sigue del Teo- 
rema 15 que c es real. Si Y es un espacio vectorial real, se puede elegir Y de modo 
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que tenga elementos reales. En efecto, entonces A y A — cl tienen elementos 
reales y como A — cl es singular, el sistema (A — cHX = 0 tiene solución 
real X no nula. Se sigue que existe un vector a, no nulo, en V tal que Ta = ca. 


Varios comentarios se pueden hacer respecto a la demostración. 

(1) La demostración de la existencia de una X no nula tal que AX = cX 
no tiene nada que ver con el hecho de que A fuese hermítica (autoadjunta). 
Ello muestra que cualquier operador lineal sobre un espacio vectorial comple- 
jo de dimensión finita tiene un vector propio. En el caso de un espacio producto 
interno real, el ser 4 autoadjunta se usa fundamentalmente para ver que Cada 
valor propio de A es real y luego que se puede hallar una X apropiada con ele- 
mentos reales. 

(2) El razonamiento muestra que el polinomio característico de una matriz 
autoadjunta tiene coeficientes reales a pesar de que la matriz puede no tener 
elementos reales. 

(3) La suposición de que V es de dimensión finita es necesaria para el teore- 
ma; un operador autoadjunto en un espacio producto interno de dimen- 
sión infinita puede no tener un valor propio. 


Ejemplo 29. Sea V el espacio vectorial de las funciones continuas de valor 
complejo (o real) en el intervalo unitario, O < rt < 1, con el producto interno 


00 = [$070 a. 


El operador «multiplicación por t», (Tf Mt) = 1f(t), es autoadjunto. Supon- 
gamos que Tf = cf. Entonces 


((—c)ft) =0, 0<t<1 


y así f(1) = O para rt % c. Como f es continuo, f = 0. Luego T tiene valores 
(vectores) propios. 


Teorema 17 Sea V un espacio producto interno de dimensión finita y sea 
T' un operador lineal sobre V. Supóngase que W es un subespacio de V que es in- 
variante por T. Entonces el cumplemento ortogonal de W es invariante por T*. 


Demostración. Recuérdese que el que W sea invariante por T' no quiere 
decir que todo vector de W quede fijo por T'; quiere decir que si a está en W 
entonces Tu está en W. Sea f en W?. Debemos mostrar que T*f está en W?, 
esto es, que (a|T*f) = O para todo a en W. Si a está en W, entonces Ta está 
en W, de modo que (Ta|f) = 0. Pero (Ta|B) = (a|T*f). M 


Teorema 18. Sea V un espacio producto interno de dimensión finita y sea 
T un operador lineal autoadjunto sobre V. Entonces existe una base ortonormal 
de V en la que cada vector es un vector propio de T. 


Demostración. Se supone que dim V > 0. Por el Teorema 16, T tiene un 
vector propio x. Sea a, = a/lla]| de modo que a, es también un vector propia 
para T y lla, || = 1. Si dim V = 1, se habrá concluido con la demostración. 
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Se procede ahora por inducción sobre la dimensión de V. Supóngase que el 
teorema es válido para espacios producto interno de dimensión menor que 
dim V. Sea W el espacio unidimensional generado por el vector a,. La afir- 
m:ción de que a, es un vector propio para T quiere decir simplemente que W es 
mvariante por 7. Por el Teorema 17, el complemento ortogonal W* es inva- 
nante por 7* = T. Ahora W, con el producto interno de V, es un espacio pro- 
ducto interno de dimensión menor en uno que la dimensión de W. Sea U el 
«operador lineal inducido en W* por T, esto es, la restricción de Ta W?*. Enton- 
ces U es autoadjunto y, por la hipótesis inductiva, W tiene una base ortonormal 


a, » --, 0.) Que consiste en vectores propios de U. Ahora cada uno de estos 
vectores es también un vector propio de T, y como Y = W GQ W?, conclui- 
mos que fa,, ..., ,) es la deseada base para V. | 


Corolario. Sea A la matriz n x n hermítica (autoadjunta). Entonces existe 
una matriz unitaria P tal que P”*AP es diagonal (A es unitariamente equivalente 
a una matriz diagonal). Si A es una matriz simétrica real, hay una matriz ortogo- 
nal real P tal que P7*AP es diagonal. 


Demostración. Sea V=C”*!, con el producto interno canónico, y sea T el 
operador lineal sobre Y representado por A en la base ordenada canónica. 


Como A = A*, tenemos que T = T*. Sea KB = [a,, ..., a, una base orde- 
nada ortonormal de V, tal que Ta, = ca, j=1,..., n. Si D=[T]g, en- 
tonces D es la matriz diagonal con elementos c,, ..., C, en esa diagonal. Sea 
P la matriz con vectores columna 2,, ..., 0,. Entonces D = P"*AP. 


En el caso de que cada elemento de A sea real, se puede tomar Y como R”, 
con el producto interno canónico, y se repite el razonamiento. En este caso 
P será uma matriz unitaria con elementos reales, es decir, una matriz ortogo- 
nal real. | 


Combinando el Teorema 18 con los comentarios que hicimos al comienzo 
de esta sección, se tiene lo siguiente: si Y es un espacio producto interno real de 
dimensión finita y T es un operador lineal sobre V, entonces V tiene una base 
ortonormal de vectores propios para T si, y solo si, T' es autoadjunto. A esto 
equivale decir: si A es una matriz n x n con elementos reales, existe una matriz 
ortogonal real P tal que P'AP es diagonal si, y solo si, A = A. No existe un 
resultado semejante para matrices simétricas complejas. En otras palabras, para 
matrices complejas hay una diferencia significativa entre las condiciones A = 
A ty A=A*. 

Habiendo visto el caso de los autoadjuntos, volvemos ahora al estudio de 
los operadores normales en general. Se demostrará el análogo al Teorema 18, 
para operadores normales, en el caso complejo. Hay una razón para esta res- 
tricción. Un operador normal sobre un espacio producto interno real puede 
no tener un vector propio no nulo. Esto es cierto, por ejemplo, para todas las 
rotaciones en R?, a excepción de dos. 


Teorema 19. Sean V un espacio producto interno de dimensión finita y T un 
operador normal sobre V. Supóngase que a es un vector de V. Entonces a es un 
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vector propio de T con valor propio « si, y solo si, a es un vector propio para T*% 
con valor propio C. 


Demostración. Supóngase que U sea un operador normal en V. Entonces 
|[Ua]| = ||U*a||. En efecto, usando la condición de que UU* = U*U se tiene que 


[[Ua]l? = (UafUa) = (a|U*Ua) 
= (aJUU*a) = (U*a U*a) = | U*a]|?. 


Si c es un escalar cualquiera, el operador U = T — cl es normal. En efecto, 
(T — cly* = T* — él con lo que es fácil de verificar que UU* = U*U. Así, 


||ET — cDal| = |1(7* — cDa]| 
de modo que (7 — cfla = 0 si, y solo si, (7* — ca = 0. | 


Definición. Una matriz compleja n x n, A, se llama normal si AA* = A*A. 


No es muy fácil entender lo que significa normal en matrices u operado- 
res; sin embargo, con objeto de desarrollar un sentido para tal concepto, el 
lector podría encontrar de utilidad saber que una matriz triangular es normal 
s1, y solo si, es diagonal. 


Teorema 20. Sean V un espacio producto interno de dimensión finita, T un 
operador lineal sobre V y KB una base ortanormal de V. Supóngase que la matriz 
A de T en la base KB es triangular superior. Entonces T es normal si, y solo si, A 
es una matriz diagonal. 


Demostración. Como G es una base ortogonal, 4* es la matriz de T* en GB. 
Si A es diagonal, entonces AA* = A*A, y esto implica que TT* = T*T. Reci- 
procamente, supóngase que T sea normal y sea G3 = ([a,, ..., 0,j. Entonces, 
como A es triangular superior, Ta, = A,,0%,. Por el Teorema 19 esto implica 
que T*a, = A,1%,. Por otro lado 


T*o = Z (A) ya 
3 
= 2 A,ja;. 
J 


Por tanto, A,;¡= 0, para todo ¡ > 1. En particular 4,, = 0, y como A es trian- 
gular superior, se sigue que 


Tos = Á 09. 


Así, T*a, = Az20, y Az; = O para todo ¡ + 0. Continuando de esta manera 
se llega a demostrar que A es diagonal. | 


Teorema 21. Sea V un espacio producto interno de dimensión finita y sea 
T' un operador lineal sobre V. Entonces existe una base ortonormal de V en la 
que la matriz de T es triangular superior. 
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Demostración, Sca h la dimensión de V. El teorema es cierto cuando n= 1, 
y se procede por inducción en xn, sunoniendo que el resultado es cierto para 
eperadores lincales en espacios producto interno complejos de dimensión 
n 1. Como V es un espacio producto interno de dimensión finita, hay un 
vector unitario a en Y y un escalar c tales que 


T*a = ca. 
Sea W el complemento ortogonal del subespacio generado por a y sea S la res- 
ticción de Ta W. Por el Teorema 17, W es invariante por T. Así que S es un ope- 
nidor lineal sobre W. Como W tiene dimensión n — 1, la hipótesis inductiva 
aplica la existencia de una base ortonormal (x%,, ...., %,_,) de W en la cual 


la matriz S es triangular superior; sea o, = a. Entonces [%,, .... q,j es una 
he ortonormal de Y en la que la matriz de T es triangular superior. |] 


Este teorema implica el siguiente resultado para las matrices. 


Corolario. Para toda matriz compleja n x hn, A, existe una matriz unitaria 
(" tal que UT* AU es triangular superior. 


Ahora, combinando el Teorema 21 con el Teorema 20, se tiene, sin más, 
cl siguiente análogo al Teorema 18 para operadores normales. 


Teorema 22. Sean V un espacio producto interno complejo de dimensión 
finita y T un operador normal sobre V. Entonces V tiene una base ortonormal 
que consiste en vectores propios de T. 


También existe una interpretación matricial. 


Corolario. Para toda matriz normal A existe una matriz unitaria P tal que 
PAP es una matriz diagonal. 


I-jercicios 


l. Para cada una de las siguientes matrices simétricas reales, A, hallar una matriz orto- 
ronal real P tal que P'AP sea diagonal. 


1 1] 1 :| cos O sen Y 
1.1) 2 1) send —cos0 
2. ¿Es una matriz simétrica compleja autoadjunta? ¿Es normal? 


3. Para 


123 
A=|2 3 4 
3 4 5 
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hay una matriz ortogonal real P tal que P *AP = D sca diagonal. Hallar tal matriz dia- 
gona)] D. 


4. Sea V = C?, con el producto interno canónico. Sea T el operador lineal sobre V re- 
presentado en la base canónica por la matriz 


l 2 
a=[; 1) 
Demostrar que T es normal y hallar una base ortogonal de V que consista en vectores pro- 
pios de T. 


5. Dar un ejemplo de una matriz 2 x 2, A, tal que A? sea normal, pero que A no lo sea. 


6. Sea T un operador normal sobre un espacio producto interno complejo de dimensión 
finita. Demostrar que T es autoadjunto, positivo, o unitario según que todos los valores 
propios de T sean reales, positivos o de valor absoluto igual a 1. (Usar el Teorema 22 para 
reducir el problema a uno similar respecto a matrices diagonales.) 


7. Sea T un operador lineal sobre el espacio producto interno de dimensión finita V y 
supóngase que T' es positivo y unitario. Demostrar que T = /. 


8. Demostrar que T'es normal si, y solo si, 7 = T, + ¿T,, donde T, y T, son operado- 
res autoadjuntos que conmutan. 

9. Demostrar que una matriz simétrica real tiene una raíz cúbica simétrica; es decir, si 
A es simétrica real, existe una simétrica real B tal que B? = A. 

10. Demostrar que toda matriz positiva es cuadrado de una matriz positiva. 

11. Demostrar que un operador normal y nilpotente es el operador cero. 


12. Si 7 es un operador ngrmal, demostrar que los vectores propios de T, asociados a 
distintos valores propios, son ortogonales. 


13. Sea T un operador normal sobre un espacio producto interno complejo de dimensión 
finita. Demostrar que existe un polinomio f, con coeficientes complejos, tal que 7* = f(T). 
(Representar 7 por medio de una matriz diagonal y ver qué debe ser f.) 


14. Si dos operadores normales conmutan, demostrar que su producto es normal. 


9. Operadores sobre espacios 
producto interno 


9.1. Introducción 


La mayoría de los temas del Capítulo 8 se consideran fundamentales. Es 
la materia que todos deben saber. El presente capítulo es para estudiantes más 
avanzados o para el lector deseosa de ampliar sus conocimientos acerca de 
operadores sobré espacios producto interno. Con la excepción del teorema 
del eje principal, que esencialmente no es más que otra formulación del Teore- 
ma 18 sobre la diagonalización ortogonal de operadores autoadjuntos, y los 
otros resultados sobre formas de la Sección 9.2, el material que aquí se pre- 
senta es más complicado y generalmente implica mayor tecnicismo. También 
exigimos más del lector, como se hizo en la parte final de los Capítulos 5 y 7. 
Los razonamientos y demostraciones están escritos en estilo más condensado 
y no se dan casi ejemplos para facilitar el camino; sin embargo, hemos pro- 
curado que el lector disponga de abundantes conjuntos de ejercicios. 

Las tres primeras secciones se dedican a los resultados concernientes a for- 
mas en espacios producto interno y a la relación entre formas y operadores 
lineales. La siguiente sección se ocupa de la teoría espectral, es decir, de las 
consecuencias de los Teoremas 18 y 22 del Capítulo 8 en lo que se refiere a la 
diagonalización de operadores autoadjuntos y normales. En la sección final 
proseguimos el estudio de los operadores normales tratando en particular el 
caso real; al hacerlo se examina lo que dice el teorema de descomposición prima 
del Capítulo 6 respecto a los operadores normales. 
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9.2. Formas sobre espacios producto interno 


Si T es un operador lineal sobre un espacio producto interno de dimensión 
finita V, la función f definida sobre Y x V por 


fla, 6) = (Ta|8) 


puede considerarse como un tipo de sustituto para 7. Muchas cuestiones res- 
pecto de T equivalentes a cuestiones respecto de f. En efecto, es fácil ver que 
f determina a 7. Pues si G3 = [a,, ..., 0, es una base ortonormal de Y, en- 
tonces los elementos de la matriz de T en (3 vienen dados por 


A sh = f(ax, Ai). 


Es importante entender por qué f determina a T desde un punto de vista más 
abstracto. Las propiedades características de f están descritas en la siguiente 
definición. 


Definición. Una forma (sesquilineal) sobre un espacio vectorial real o com- 
plejo V es una función f sobre V x V com valores en el cuerpo de los escalares 
tal que : 


(a) fico, + PB. y)= fla y) + AB, y) 
(b) flo, cf + y) = Gflo, B) + fo. y) 


para todo a, f, y de V y todos los escalares c. 


Así, una forma sesquilineal es una función sobre V x V tal que fía, f) 
es una función lineal de a para f fijo y una función lineal-conjugada de f para 
o fijo. En el caso real, f(a, f) es una función lineal de cada argumento; o sea 
que f es una forma bilineal. En el caso complejo, la forma sesquilineal f no 
es bilineal, a menos que f = 0. En el resto de este capítulo se omitirá el adjetivo 
«sesquilineal», salvo que sea importante tenerlo en cuenta. 

Si f y g son formas sobre V y c es un escalar, es fácil probar que cf + g es 
también una forma. De esto se concluye que toda combinación lineal de formas 
sobre V es a su vez una forma. Asi, el conjunto de todas las formas sobre Y 
es un subespacio del espacio vectorial de las funciones escalares sobre V x V. 


Teorema 1. Sean V un espacio producto interno de dimensión finita y f 
una forma sobre V. Entonces existe un operador lineal único sobre V tal que 


Fa, P) = (Ta|P) 


para cualesquiera a. $ de V, y la aplicación f — T es un isomorfismo del espacio 
de las formas sobre L(V, V). 


Demostración. Fijado el vector f en V, entonces a —> fía, ff) es una fun- 
ción lineal sobre V. Por el Teorema 6 existe un vector único ff” de V tal que 
fla, PB) = (a|f8") para todo a. Se define una función U de V en V haciendo Uf = f". 
Entonces 
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flalcf + y) 


(aJU(cfB + y) 

fla, B) + Fa, y) 

c(a| UB) + (a| Uy) 

(alcUf + Uy) 

para cualesquiera a, f, y en V y todos los escalares c. Así, U es un operador 
lincal sobre V, y T = U* es un operador tal que fla, P) = (Ta|f) para todo 
x y f. Si tenemos también que f(a, $) = (T'x|f), entonces 


(Ta — T'alg) = 0 


para todo a y ff; con lo que Ta = T'a para todo a. Así, para cada forma f existe 
un único operador lineal 7, tal que 


Fa, 6) = (Tya]6) 


para todo a, f de V. Si f y g son formas y c un escalar, entonces 


(cf + gía, 6) = (Tesryal8B) 

cf(a, B) + gla, 6) 
c(Tyal8) + (Tyal6) 
((cT, + T¿Jal8) 


para todo a y f de V. Por tanto, 
Testo = CT + T, 

y f —>T, es una aplicación lineal. Para todo T en L(V, V) la ecuación 
Fa, 6) = (Tal8) 


define una forma tal que 7, = T, y T, = 0 si, y solo sí, f = 0. Asi, f —= T, es 
un isomorfismo. | 


Corolario. La ecuación 
Y l2) = tr (T,T, 
define un producto interno sobre el espacio de las formas con la propiedad de que 
Ulg) = z HA, ae (oy, 0,) 
para toda base ortonormal Ía,, ..., 0%, ; de V. 


Demostración. Se sigue fácilmente del Ejemplo 3 del Capítulo 8 que (7, U)—= 
tr (TU*) es un producto interno sobre L(V, V). Como f— T, es un isomor- 
fismo, el Ejemplo € del Capitulo 8 muestra que 


(Vlg) = tr (T,T;5) 


es un producto interno. Supongamos ahora que 4 y B son las matrices de T, y 
T, en la base ortonormal GB == (a,, ..., a). Entonces 


Aj = (Tjaxlaj) = flan, 05) 
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y Bj = (T,0,]a,) = glo, a,). Como AB* es la matriz de T,Tf en la base G, 
se sigue que 


(YVle) = tr (AB*) = 2 AB. i 


Definición. Si f és una forma y BG = (a,, ..., 0.) una base ordenada ar- 
“bitraria de V, la matriz A de elementos 


Á ge = Has, 0,) 
se llama matriz de f en la base ordenada 05. 


Cuando 6 es una base ortonormal, la matriz de f en 03 es también la matriz 
de la transformación lineal T,, pero en general éste no es el caso. 
Si A es la matriz de f en la base ordenada GB = (u,, ..., a,), se sigue que 


. (9-1) FE Loy 2 y,a,) = Zz 7, A reLa 


para todos los escalares xx, é y, (1 < r, s < n). O sea que la matriz A tiene la 
propiedad de que 


fla, B) = Y*AX 
donde X e Y son las respectivas matrices de coordenadas de a y f.en la base 
ordenada Gh. 
La matriz de f en otra base 
= 2 Pijas, (l <j<nm) 
está dada por la ecuación 
(9-2) A = P*AP. 
En efecto, , , 
An = f(ax, ay) 
= 02 P.0s, > P,50r) 


= 2 P.¡ArP or 


= (P*AP) y. 


Como para las matrices unitarias es P* = P”!, se sigue: de (9-2)'que los 
resultados que conciernen a la equivalencia unitaria pueden aplicarse al estu- 
dio de las formas. 


Teorema 2. Sea f una forma en un espacio producto interno complejo de 
dimensión finita. Entonces existe una base ortonormal de V en la que la matriz 
de f es triangular superior. 


Demostración. Sea T el operador lineal sobre V tal que fla, $) = (Ta|f) 
para todo a y f. Por el Teorema 21, existe una base ortonormal (a,, ...., 0,) 
en que la matriz de T' es triangular superior. Luego, 


Operadores sobre espacios producto imierna 3IY 


faz, aj) = (Tarja) = 0 
1j>k. 
Definición. Una forma f sobre un espacio vectorial real, o complejo, V se 


llurma hermítica sí 
Fa, P) = NB, a) 
pura todo a y f en V. 


Si 7 es un operador lineal sobre un espacio producto interno de dimensión 
tinita Y y f es la forma 


fla, B) - (Ta|B) 


entonces f(B, a) = (a]TfB) = (T*a|f); así que f es hermitica si, y solo si, T es 
autoadjunto. 

Cuando f es hermítica, f(a, a) es real para todo a, y en los espacios com- 
plejos esta propiedad caracteriza a las formas hermíticas. 


Teorema 3. Sean V un espacio vectorial complejo y f una forma sobre V 
tal que fla, a) sea real para todo a. Entonces f es hermítica. 


Demostración. Sean a y f vectores de V. Se debe demostrar que fla, PB) = 


I(f, a). En efecto, 
flo + 6, a + 6) = Fa, 8) + Fa, B) + f(8, a) + f(6, 6). 


Como f(a + f, a + $), fla, a) y f(B. f) son reales, el número fla, $) + F(B, a) 
es real. Por el mismo razonamiento, con a + if en vez de a + f, vemos que 
—if(a, PB) + NB, a) es real. Habiendo concluido que esos dos números son 
reales, se les hace iguales a sus complejos conjugados y obtenemos 


fla, 6) + $(6, a) = fla, B) + F(6, a) 
—Y (a, 8) + 1f(6, a) = f(a, 6) — y (6, a) 


Si multiplicamos la segunda ecuación por ¡ y se suma a la primera ecuación, 
tenemos 


2f(a, 2) = 2(B,0). M 


Corolario. Sea T un operador lineal sobre un espacio producto interno com- 
plejo de dimensión finita. Entonces T es autoadjunto si, y solo si, (Tala) es real 
para todo a de V. 


Teorema 4 (teorema del eje princip:.b). Para toda forma hermítica f en un 
espacio producto interno de dimensión finita V, existe una base ortonormal de 
V en la que f está representada [or una matriz diagonal con elementos reales. 


Demostración. Sea T el operador lineal tal que f(a, $) = (Ta|f) para todo 
a y B de V. Entonces, como fla, B) = f(B, x) y (TB, a) = (a|Tf), se sigue que 


(Talf) = F(6, a) = (alP8) 
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para todo a y ff; lucgo 1 = T*. Por el Teorema 18 del Capítulo 8, existe una 
base ortonormal de V formada por los vectores característicos para T. Supón- 
ase que (0%, -..., %,¿ €s una base 

gase q 1 ” na base ortonormal ue 


Ta; = Cja; 
para 1 <j¡< n. Entonces 


f(0,, a) = (Tasla;) = 6x3Cr 
y por el Teorema 15 del Capítulo 8, todo c, es real. | 


Corolario. En las condiciones anteriores 


NS xja;, 2 y nox) = 2 Cixi);. 
J J 


Ejercicios 


1. ¿Cuáles de las siguientes funciones f definidas para los vectores a = (x,, X,) y 
B = (1. y,) de C? son formas (sesquilineales) sobre C?? 


(a) fla, B) = 1. 

(b) fa, B) = (21 — Y)? + taa. 

(c) fa, B) = (11 + y)? — (21 — ya)?. 
(d) fa, PB) = t1j2 — ToYr. 


2. Sea f la forma sobre R? definida por 
Fzxs, Yo), (22, Yo)) = TY + ToYo. 


Hallar la matriz de f en cada una de las siguientes bases: 


(1, 0), (0, 0, (11, —D), (1, 19), (LU, 2), (3, 4). 


a=[_; 2] 


y sea g la forma (en el espacio de las matrices complejas 2 x 1) definida por g(X, Y) = 
FAX. ¿Es g un producto interior? 


3. Sea 


4. Sea V un espacio vectorial complejo y sea f una forma (sesquilineal) simétrica sobre V: 


Ha. P) = JB. a). ¿Qué es f? 
5. Sea f la forma sobre R? dada por 
f(x, 22), (Ya, Y2)) = Y + 4t9Y2 + 201y2 + 220Y1. 
Hallar una base ordenada en la que f esté representada por una matriz diagonal. 


6. La forma f se llama no degenerada (a la izquierda) sí U es el único vector a tal que 
Ha, $) = O para todo $. Sea f una forma sobre un espacio producto interno V. Demostrar 
que f es no degenerada si. y solo si, el operador lineal asociado T, (Teorema 1) es no singular. 


7. Sea f una forma en un espacio vectorial de dimensión finita V. Se hace referencia a 
la definición de la no degeneración a la izquierda dada en el Ejercicio 6. Definir la no de- 
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yencración a la derecha y demostrar que la forma f cs no degcnerada a la izquierda st, y solo 
sI. es no degenerada a la derecha. 
8. Sca f una forma no degenerada (Ejercicios 6 y 7) en un espacio V de dimensión finita. 


Sea L un funcional lineal sobre V. Demostrar que existe un vector $, y solo uno. en V tal 
que L(a) = fla, $) para todo «. 


Y. Sea f una forma no degenerada en un espacio V de dimensión finita. Mostrar que cada 
operador lineal S tiene un «adjunto respecto de f». es decir, un operador S” tal que 
f(Sa, P) = fía, SP) para todo a, f. 


9.3. Formas positivas 


En esta sección se examinarán formas (sesquilineales) no negativas y sus 
relaciones con un producto interno dado sobre el espacio vectorial principal. 


Definiciones. Una forma f en un espacio vectorial real o complejo V es no 
negativa si es hermítica y fla, a) > O para todo a. en V. La forma f es positiva 
si f es hermítica y fla, a) > 0 para todo a $ O. 


Una forma positiva en V es simplemente un producto interno sobre V. Una 
forma no negativa satisface todas las propiedades de un producto interno, 
con la excepción de que hay vectores no nulos que pueden ser «ortogonales» 
consigo mismos. 

Sea f una forma en un espacio Y de dimensión finita. Sea G = [a,,..., 4) 
una base ordenada de Y y sea A la matriz de f en la base G, esto es, A ” = Fay, 0). 
S10 = x,% +: + Xx,0,, entonces 


fla, a) = F(2 tja,, z Tx0t4) 
3 
= Y Y 2,%1f(0;, 04) 
7 k 


l 


Y z At ;Tk 


j 
. y » 
Así, pues, se ve que f es no negativa si, y solo si, 
A = A* 
y 


(9-3) 22 A,¡x¡X, > 0 para todos los escalares x,,  ., Xp. 
j k 


Para que f sea positiva, la desigualdad (9-3) debe ser estricta para todo 


(X1> - >, xn) E 0. Las condiciones deducidas dicen que f es una forma positiva 
en V si, y solo si, la función 


g(X, Y) = Y*AX 


es una forma positiva en el espacio de las matrices columnas sobre el cuerpo 
escalar. 
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Teorema 5. Sea F el cuerpo de los números reales o el cuerpo de los nú- 
meros complejos. Sea Á una matriz n x n sobre F. La función g definida por 


(9-4) g(X, Y) = Y* aX 


es una forma positiva en el espacio F"** si, y solo si, existe una matriz inversi- 
ble P, con elementos en F, tal que A = P*P. 


Demostración. Para cualquier matriz n x n, A, la función g de (9-4) es 
una forma en el espacio de las matrices columnas. Se demostrará que g es po- 
sitiva si, y solo si, A = P*P. Primeramente, supóngase que A = P*P. Enton- 
ces g es hermítica y 


(Xx, X) = X*P*PX 
= (PX)*PX 
> 0. 


Si P es inversible y X + 0, entonces (PX)*PX > 0. Ahora supóngase que g 
es una forma positiva en el espacio de las matrices columnas. Entonces es un 
producto interno y, por tanto, existen matrices columnas Q,, ..., OQ, tales que 


05 = g(Q;, Qu) 
= QíAQ). 
Pero esto dice, justamente, que si Y es la matriz con columnas Q,, ..., O,, 


entonces Q* 40 = I. Como [0,, ..., Q,) es una base, Q es inversible. Con 
P=0Q"! se tiene A = P*P. | 


En la práctica no es tan fácil verificar si una matriz dada, A, satisface el 
criterio de positividad que se ha dado hasta ahora. Una consecuencia del último 
teorema es que si g es positiva, entonces det A > 0, ya que det 4 = det (P*P) = 
det P* det P = |det P|?. El que det A > 0 no quiere decir que sea suficiente 
para garantizar que g es positiva; sin embargo, hay n determinantes asociados: 
con Á que tienen esta propiedad: si A = A* y si cada uno de estos determinantes 
es positivo, entonces g es una forma positiva. 


Definición. Sea A una matriz n x n sobre el cuerpo F. Los menores principales 
de A son los escalares A/A) definidos por 
Ari --- Ár 
Ar --- Á 


lA 
Q 
lA 
So 


Lema. Sea A una matriz inversible n x n con elementos en un cuerpo F. 
Las dos afirmaciones siguientes son equivalentes. 


(a) Existe una matriz triangular superior P con Py =1(1<kS<m) tal 
que la matriz B = AP es triangular inferior. 


(b) Los menores principales de A son todos distintos de 0. 
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Demostración. Seca P cualquier matriz n x n y hágase B = AP. Entonces 
Br = 2 A ¡rPrr. 


Si P es triangular superior y P,, = 1 para todo k, entonces 
k-1 
z A Pr = Bix — Ars, k > 1. 


Ahora bien, B es triangular inferior siempre que Bj, = O para ¡ < k. Así, pues, 
B será triangular inferior si, y solo si, 


k-—1 
(9-5) Y AryPri = —Auxt, 1I<j<k-—1 
r=1 2<k<n. 


Con lo que vemos que la afirmación (a) del lema es equivalente a la afirmación 
de que existen escalares P,,, 1<r<k, 1<kS< mn, que satisfacen (9-5) y 
Pu =1,1<k<mn. 

En (9-5), para todo k > 1 tenemos un sistema de k — 1 ecuaciones lineales 
para las incógnitas P,;, Pax, ..- , Px-1.x- La matriz de coeficientes de ese sis- 
tema es 


Án e.” Árta 


Ars << Árikr 


y su determinante es el menor principal A, _,(4). Si cada A, - ¡(4) + O, el sis- 
tema (9-5) tiene soluciones únicas. Hemos demostrado que la afirmación (b) 
implica la afirmación (a) y que la matriz P es única. 
Ahora supóngase que se verifica (a). Entonces, como se verá, 
Az(A) = Ax(B) 
= BiBa :-+ Bix, k=1,...,2. 


Para verificar (9-6), sean A,,..., Any B,, ..., B, las columnas de A y B, res- 
pectivamente. Entonces 


B, = Á, 


(9-6) 


9-7 r—1 
) B, = > P,,Aj+ As, r>l. 
j=1 


Se deja fijo k, 1 < k < nm. Por (9-7) se ve que la r-ésima columna de la matriz 
Ba > Bo 
Ba - Ba 

se obtiene sumando a la r-ésima columna de 
Ay 2... Ar 


Ar e.” Á rx 


324 Algebra lincal 


una combinación lineal de sus otras columnas. Tales operaciones no alteran 
los determinantes. Lo que demuestra (9-6), a excepción de la observación tri- 
vial de que por ser B triangular, A¡(B) = B,,, ..., B;;. Como A y P son 1n- 
versibles, B es inversible. Por tanto, 


A(B) = Bi +++ Bun>0 
y así A(A)+40,k=1,...,nm. 


Teorema 6. Sea f una forma en.un espac.o vectorial V de dimensión finita 
y sea A la matriz de f en una base ordenada 6. Entonces f es una forma positiva 
si, y solo si, A = A* y los menores principales de A son todos positivos. 


Demostración. Hagamos la mitad interesante del teorema. Supóngase que 
A = A* y que A,(4) > 0, H< k < n. Por el lema existe una matriz triangular 
superior (única) P con Pi, = 1 tal que B = AP es triangular inferior. La matriz 
P* es triangular inferior, con lo que P*B = P*AP es también triangular im- 
ferior. Como A es autoadjunta, la matriz D = P*AP es autoadjunta. Por el 
mismo razonamiento que llevó a (9-6), 


Ax(D) = A.P*B) 
= Ay(B) 
= AHA). 


Como D es diagonal, sus menores principales son 
Arx(D) = Di ... Drs. 


De A/D) > 0, 1<k< n, se obtiene que Dj, > O para todo k. 
Si A es la matriz de la forma..f en la base ordenada BG = ([a,,..., a), en- 
tonces D = P*AP es la matriz de f en la base (a;, .... a,j definida por 


o —= y P ijQg. 
21=1. 
Véase (9-2) Como D es diagonal.con elementos positivos en su diagonal, es 
obvio que 
X*DX > 0, XxX0 


de lo que se sigue que f es una forma positiva. 
Ahora supóngase que f es una forma positiva. Se sabe que A = A*. ¿Cómo 
se demuestra que A,(4) > 0, 1 <k < n? Sea V, el subespacio generado por 


0, ..., 0, y sea f, la restricción de fa V, x V,. Evidentemente f, es una forma 
positiva en Y, y, en la base [x,, ..., a,), está representada por la matriz 

Án ... Áy 

An +: Am 


Como consecuencia del Teorema $5 se observó que la positividad de la forma 
implica que el determinante de cualquier. matriz que la represente es positiva. | 
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Quedan algunos comentarios por hacer para completar el estudio de la 
relación entre formas positivas y matrices. ¿Qué es lo que caracteriza las ma- 
trices que representan a las formas positivas? Si f es una forma en un espacio 
vectorial complejo y A es la matriz de f en cierta base ordenada, entonces f 
será positiva si, y solo si, A = A* y 


(9-8) X*AX >0, para todo X + 0 complejo 


Se sigue del Teorema 3 que la condición A = A* es redundante, es decir, que 
(9-8) implica A = A*. Por otro lado, si se tiene un espacio vectorial real. la forma 
/ será positiva si, y solo si, A = A* y 


(Y-9) XAX > 0, para todo X 4H O real. 


Hay que recalcar que si una matriz real A satisface (9-9) no se desprende de 
eso que A = 4”. Lo que sí es cierto es que si se cumplen A = 4' y (9-9), enton- 
ces también se verifica (9-8). Y es porque 


(X + 1Y)A(X + 1Y) = (X* — ¡YSA(X + 1Y) 
= X'AX 4 Y'AY +3(Xx4Y — Y:4X] 


y si A = A', entonces T'AX = X'AY. 

Si A es una matriz n x n de elementos complejos y si A satisface (9-9), se 
dirá que A es una matriz positiva. Los comentarios que acabamos de hacer 
pueden resumirse diciendo: en los casos real o complejo, una forma f es posi- 
tiva si, y solo si, su matriz en cierta base (de hecho, en toda) ordenada es una 
matriz positiva. 

Supóngase ahora que V es un espacio producto interno de dimensión finita. 
Sea ff una forma no negativa en V. Existe un único operador autoadjunto T 
sobre Y tal que 


(9-10) fla, B) = (Tal6). 
y T tiene, además, la propiedad de que (Tao) > O. 


Definición. Un operador lineal T sobre un espacio producto interno de di- 
mensión finita V es no negativo si T = T* y (Tala) > O para todo a de V. Un 
operador lineal es positivo si T = T* y (Tola) > O para todo x + 0. 


Si V es un espacio vectorial (real o complejo) de dimensión finita, y si (-|-) es 
un producto interno sobre V, hay una clase asociada de operadores lineales 
positivos sobre V. Mediante (9-10) existe una correspondencia biunivoca entre 
esta clase de operadores positivos y la colección de todas las formas positivas 
en V. Se usarán los ejercicios de esta sección para destacar la relación entre 
operadores positivos, formas positivas y matrices positivas. El siguiente resu- 
men puede ser de utilidad. 

Si A es una matriz n x n sobre el cuerpo de los números complejos. las 
siguientes afirmaciones son equivalentes. 


(1) A es positiva, es decir, 2 2 Ay¡X¡X, > O siempre que Xy, ..., X, sean 
J 
números complejos, no todos 0. 
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(2) (X|Y) = Y*AY es un producto interno en el espacio de las matri- 
ces complejas n x 1. 

(3) Respecto al producto interno canónico (X 
n x t, el operador lineal X — AX es positivo. 

(4) A = P*P para alguna matriz inversible n x n,” P, sobre C. 

(S) A = A*, y los menores principales de A son positivos. 

Si todo elemento de A es real, éstas equivalen a las siguientes: 

(6) A= AF", y £ 2 AyjX¡X; > O siempre que Xy, ..., Xx, sean números 

J 


Y) = Y*X de matrices 





reales no todos nulos. 

(7) (X|F) = Y'AX es un producto interno sobre el espacio de las ma- 
trices n x 1 reales. 

(8) Respecto al producto interno canónico (X|Y) = YX, sobre las ma- 
trices reales n x 1, el operador lineal X—> AX es positivo. 

(9) Existe una matriz inversible n x n, P, con elementos reales tal que 
A = P'P. 


Ejercicios 


1. Sea Y = C?, con el producto interno canónico. ¿Para cuáles vectores a de Y hay un 
operador lineal positivo T tal que x = Te,” 

2. Sea Y = R?, con el producto interno canónico. Si O es un número real, sea T el ope- 
rador lincal «rotación 0», 


TAx,. x,) = (x, cos 0 — x, sen 0, x, sen 0 + x, cos 0). 
¿Para qué valores de Q es T, un operador positivo” 


3. Sea V el espacio de las matrices n x 1 sobre C, con el producto interno (X| Y) -= Y*GX 
(donde G es una matriz n x n tal que éste sea un producto interno). Sean A una matriz 
n ny Tun operador lineal T(X) = AX. Hallar 7*. Si Y es un elemento fijo de Y, hallar 
el elemento Z de V que determina el funcional lineal X= Y*X. En otras palabras, hallar 
Z 1al que Y*X = (X|Z) para todo X de Y. 


4. Sea V un espacio producto interno de dimensión finita. Si 7 y U son operadores linea- 
les positivos sobre V, demostrar que (7 + U) es positivo. Dar un ejemplo que muestre 
que TU no tiene que ser positivo necesariamente. 


5. Sea A= h 3]: 


(a) Demostrar que A es positiva. 
(b) Sea V el espacio de las matrices reales 2 x 1, con el producto interno (X | Y) = FAX. 
Hallar una base ortonormal de V aplicando el proceso de Gram-Schmidt a la base (X,, X,) 


definida por 
_ %-[) -[9 
Lol 2 LI 


(c) Hallar una matriz real inversible 2 x I. P, tal que A = P'P. 
6. ¿Cuáles de las siguientes matrices son positivas? 


E 27 [ 1 +9) E 7 | E 
, . , , 2 
3 4 1 = 1 3 3-1 1 j 


Mo |pmá Elias jr 


Cajon ojos Cos 
Lora) 


Operadores sobre espacios producto interno 327 


7. Dar un ejemplo de una matriz n x n que tenga todos sus menores principales positi- 
vos, pero que no sea una matriz positiva. 


8. ¿Define ((x,, x2) (91, y2)) = xF, + 2x,9, + 2x,9, + x2P, un producto interno so- 
bre C?? 


%. Demostrar que todo elemento de la diagonal principal de una matriz positiva es po- 
sIfIVO. 


10. Sea Y un espacio producto interno de dimensión finita. Si T y U son operadores linea- 
les sobre V, se escribe T < U si U — T es un operador positivo. Demostrar lo siguiente: 
(a) T< Uy U < T es imposible. 
(b) Si T<Uy U<S, entonces T < $. 
(c) Ss F<Uy 0<S, no es necesariamente ST < SU. 


Íf. Sean V un espacio producto interno de dimensión finita y E la proyección ortogonal 
de Y sobre algún subespacio. 
(a) Demostrar que, para cualquier número positivo c, el operador cf + E es positivo. 
(b) Expresar por E un operador lineal autoadjunto T' tal que 7? = / + E. 


12. Sea n un entero positivo y A la matriz n x n 








1 1 1 
2 3 n 

1 1 Y 

A = 3 4 n+1 
1 1] 1 

n+1 n+2 2n— 1 





Demostrar que A es positiva. 


13. Sea A una matriz n x n autoadjunta. Demostrar que existe un número real c tal que 
la matriz cl + A es positiva. 


14. Demostrar que el producto de los operadores lineales positivos es positivo si, y solo si. 
conmutan. 


15. Sean S y T' operadores positivos. Demostrar que todo valor propio de ST es positivo. 


9.4. Mas sobre formas 


Esta sección contiene dos resultados que dan información más detallada 
acerca de formas (sesquilineales). 


Teorema 7. Sean f una forma en un espacio vectorial real, o complejo, 
V y (2,, ..., 0,) una base del subespacio W de V de dimensión finita. Sea M la 
matriz r x r de elementos 


My = f(0;, 0;) 
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y W”" el conjunto de todos los vectores fB de V tales que fla, $) = O para todo a 
de W. Entonces W' es un subespacio de V y WN W' = (0) si, y solo si, MA es 
inversible. Si este es el caso, Y = W+ W"' 


Demostración. S1 f y y son vectores de W” y c es un escalar, entonces para 
todo a en W 


fla, cf + y) = fla, fB) + fa, y) 


Luego, W” es un subespacio de Y. 
Supóngase ahora que a = y, Tus y que 6 = z Yj0;- Entonces 
= j= 
Fa, B) = E YM ¡rta 
jk 
= 2 (z YM sk). 


Se sigue de esto que W (Y W' 4 [0] si, y solo si, el sistema homogéneo 
2 YiMj =00, 1<k<r 
ja 


tiene una solución no trivial (y,, ..., y,). Luego W (1 W' = 0] si, y solo si, 
M* es inversible. Pero ser M* inversible es equivalente a ser M inversible. 
Supóngase que M es inversibile y sea 


A = (M*)" = (MA?, 


Definase g, sobre V por la ecuación 


gí(6) = y A jf(as, B)- 
k=1 
Entonces 


gilcó + y) = 2 A fla, CO + y) 
=€ z Aj Jas, 6) + 2 Aj flax, Y) 
= cgi(B) + gs(v). 


Luego toda g, es una función lineal sobre V. Así, pues, se puede definir un ope- 
rador lineal E sobre Y haciendo 


Como 
gi[an) = z Ajf(0r, An) 


= z AMM en 


= in 
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se sigue que Ela, ) = a, para | <n< r. Esto implica que Ex = a para todo 
s de W. Por tanto, E aplica Y sobre W y E? = E. Si f es un vector arbitrario 
de Y, entonces 


f(An, Ef) =f (e. Zz gi(B)as) 
= z gi) (An, aj) 
= z (2 Ajyflas, B)) f(a,, a). 
Como A* = M'?, se sigue que 
Fan, Ef) = 2 (2 (MD; M sn ) faz, B) 
EN 
- z dun f (ar, B) 


= f(0n, B). 
Esto implica f(a, EP) = fla, PB) para todo a de W. Luego, 
fla, B — Ef) = 0 
para todo a de W y todo f de V. Así, I — E aplica V en W”. La igualdad 
PB = EB + (I — E)B 


muestra que Y = W + W”. Es de mencionar un último punto. Como W (y 
W" = (0), todo vector de Y es suma única de un vector de W y un vector de 
W”. Si $ está en W' se sigue que Ef = O. Luego / — E aplica Y sobre W*. | 


La proyección E construida en la demostración puede caracterizarse de la 
siguiente manera: Ef = a si, y solo si, a está en W y f — a pertenece a W”. 
Así, E es independiente de la base de W utilizada en su construcción. Luego 
E se puede tratar como la proyección de V sobre W que está determinada por 
la destomposición en suma directa 


V= WOW. 


Obsérvese que E es una proyección ortogonal si, y solo si, W' = W?. 


Teorema 8. Sean f una forma en un espacio vectorial real, o complejo, V y 
A la matriz de f en la base ordenada fa,, ..., a,) de V. Supóngase que los me- 
nores principales de A son todos distintos de O. Entonces existe una única matriz 
triangular superior P con Ps = 1 (1 <k< n) tal que 


P*AP 
es triangular superior. 
Demostración. Como A,(A4*) = A,(4) (1 < k < nm), los menores principa- 


les de A* son todos distintos de 0. Luego, por el lema utilizado en la demos- 
tración del Teorema 6, existe una matriz triangular superior P con Pi, = 1 
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tal que A*P es triangular inferior. Por tanto, P*A = (A*P)* es triangular su- 
perior. Como el producto de las matrices triangulares superiores es también 
triangular superior, se sigue que P*AP es triangular superior. Esto muestra 
la existencia, pero no la unicidad de P. Sin embargo, hay otro razonamiento, 
más geométrico, que puede usarse para demostrar la existencia y unicidad de P. 

Sean W, el subespacio generado por ay, ..., 0%, y W, el conjunto de todos 
los f$ de Y tales que f(x, B) = O para todo a de W,. Como A,(A) H 0, la ma- 
triz k x k, M, de elementos 


Ms = fla;, 05) = As; 
(1 <í j< k) es imversible. Por el Teorema 7 
V = W0VW:. 


Sea E, la proyección de Y sobre W, determinada por esta descomposición, y 
sea E, = 0. Sea 


PBi=0a—Er,  (1<k<mnm). 


Entonces f, = a, y E, - ,%, pertenece a W, , para k > l. Así, cuando k > 1, 
existen escalares únicos P,, tales que 


k-1 
Ex 0 = — 2 P jkQAj. 
j=1 


Haciendo Pi, = 1 y P, =0 para ¡> k, se tiene entonces una matriz n x n 
triangular superior P con Py, = 1 y 


k 
Bi = Y Pira; 
J=1 


para k= 1, ..., n. Supóngase que 1 < ¿< k. Entonces f, está en W, y 
W, C W,-1. Como Bf, pertenece a W,-_,, se sigue que f(f;, fB,) = O. Sea B la 
matriz de f en la base ordenada (fB,, .... fB,). Entonces 


Br; = Bs, Bx) 
con lo que B,; = 0 cuando k > i. Así B es triangular superior. Por otro lado, 
B = P*AP. 


Reciprocamente, supóngase que P es una matriz triangular superior con 
Pu = 1 tal que P*AP es triangular superior. Se hace 


Bi = 2 Pia, (1<k<m). 
J3 
Entonces [f,, ..., fB,) es evidentemente una base de W,. Supóngase que k > 1. 


Entonces [B,, ..., B,-,) es una base para W, _ ,, y como f(f;, fB,) = O cuando 
¡ < k, se ve que f, es un vector de W,_,. La ecuación que define f5, implica 


k—1 
Ak = — (z Pos) + Bs. 
J= 
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k-1 
Ahora bien, z P,,o, pertenece a W, - , y fh estáen W;_ ,. Por tanto, P,x,..., Pa- 14 
JyJ= 


son los únicos escalares tales que 
Kk-—1 


Ex 0 = — z Pra; 
gu 


con lo que P es la matriz construida anteriormente. |] 


9.5. Teoría espectral 


En esta sección prosiguen las consecuencias de los Teoremas 18 y 22 del 
Capítulo 8 referentes a la diagonalización de operadores autoadjuntos y normales. 


Teorema 9 (teorema espectral). Sea T un operador normal sobre un espacio 
producto interno complejo de dimensión finita V o un operador autoadjunto sobre 
un espacio producto interno real de dimensión finita V. Sean c,, .. ., c, los valores 
propios distintos de T. Sea W, el espacio propio asociado a c; y E, la provección 
ortogonal de W sobre W,. Entonces W; es ortogonal a W, si i 4 j, V es la suma 
directa de W,,.... W, y 


(9-11) T = c¡E, + cc: + CE, . 


Demostración. Sea a un vector de ww, f un vector de W, y supóngase que 
¡ ei Entonces c;(a|f$) = (Ta|B) = (| TB) = (ae, B). Luego (0; — €; Ma|B)= 0 

, como Cc, — €, H 0, se sigue que (a, $) = 0. Asi W; es ortogonal a W, si 1H j. 
Del hecho de que Y tiene una hase ortonormal de vectores propios (véanse 
Teoremas 18 y 22, del Capitulo 8), se sigue que V = W, +++: + M,. Si a, 
pertenece a V, (1 <j<K) y 91 +: + 0, = 0, entonces 


O = (ailZ aj) = 2 (a;la;) 
3 J 
= llos]? 


para todo ¿, con lo que V es la suma directa de W,, ..., W,. Por tanto, 
EL +++ E,=1 y 


T=TE,+ «+: +TEs 


=ME,+ *-:+E,. 1 


La descomposición (9-11) se llama descomposición espectral de 7. Esta ter- 
minología proviene en parte de aplicaciones físicas que han hecho que se de- 
fina el espectro de un operador lineal sobre un espacio vectorial de dimensión 
finita como el conjunto de valores propios para el operador. Es importante 
observar que las proyecciones ortogenales £,, ..., E, están asociadas canóni- 
camente con 7'; en realidad, son peliiomios en 7. 


17 A) entonces E; = ej T) para 1 <j< xk 


Corolario. Si e ¡= n (e 
+) C; 
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Demostración. Como E,E;=0 si ¡+ j, se sigue que 
T?2=dE,+ --- + «Eb 
y por un sencillo razonamiento inductivo que 
Tr =GE, + --- + ciEs 


para todo entero n > 0. Para un polinomio arbitrario 


se tiene 


HT) = Y a,T” 


Como €;(C,,) = om se sigue que e¡(7) = E,. 
Por estar E,, ..., E, asociados canónicamente con T y 
IT =E1+ -** +Ex 


La familia de proyecciones jE,, ..., E,j se llama descomposición de la identidad 
definida por 7. 

Cabe hacer un comentario respecto a la demostración del teorema espec- 
tral. Se derivó el teorema usando los Teoremas 18 y 22 del Capítulo 8 sobre 
la diagonalización de operadores autoadjuntos y normales. Hay otra demos- 
tración más algebraica, en la que debe demostrarse primero que el polinomio 
minimal de un operador normal es un producto de factores primos distintos. 
Luego se procede como en la demostración del teorema de la descomposición 
prima (Teorema 12, Capítulo 6). Daremos una demostración así en la siguien- 
te sección. 

En diversas aplicaciones es necesario saber si se pueden calcular ciertas 
funciones de operadores o matrices, v.gr., raíces cuadradas. Esto se puede hacer 
muy sencillamente para operadores normales diagonalizables. 


Definición. Sea T un operador normal diagonalizable sobre un espacio pro- 
ducto interno de dimensión finita V y sea 


su resolución espectral. Supóngase que f es una función cuyo dominio incluve 
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el espectro de T, que tenga valores en el cuerpo de los escalares. Entonces el ope- 
rador lineal f(T) está definido por la igualdad 


(9-12) [0)= ENDE, 


Teorema 10. Sea T un operador normal diagonalizable con espectro S en. 
un espacio producto interno de dimensión finita V. Supóngase que f es una función 
cuyo dominio contiene a S y que toma valores en el cuerpo de los escalares. Enton- 
ces F(T) es un operador normal diagonalizable de espectro f(S). Si U es una apli- 
cación unitaria de V sobre V' y T' = UTU”?, entonces S es el espectro de T' y 

AT") = UN(TJU"" 

Demostración. La normalidad de f(7) se desprende de un sencillo cálculo 

a partir de (9-12) y de que 
KT)" = 2 SC)ES 
Además, es evidente que para todo a en E;(V) 
FT)]a = f(cjda. 

Así, el conjunto f(S) de todos los f(c) con c en S está contenido en el espectro 
de f(7). Reciprocamente, supóngase que a + O y que 

fDa = ba. 
Entonces a = 2 Eja y 


J 


fT)a = ZJDEs 
= 2 JCHEjo 
= ZbEja. 
Luego 
1» (fc) — d)Ejall? = Zz |f(cj) — db Eja]|? 
= 0. 
Por tanto, f(c,) = bo Eja = 0. Por hipótesis, a + O, así que existe un índice 


¡ pará el que Ea + 0. Se sigue que f(c;) = b y por consiguiente que f(S) es el 
espectro de f(T). Supóngase, en efecto, que 


FS) = (br... , dr) 
donde b,, + b, sim É n. Sea X,, el conjunto de índices í tales que l < ¡<k 
y f(c;) = b,. Sea P,, = X E, la suma extendida a los índices i de X,,. Enton- 


ces P, es la proyección ortogonal de V sobre el espacio de los vectores propios 
que corresponden a los valores propios b,, de f(T), y 


NT) = 2 baPn 


es la descomposición espectral de (7). 
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Supóngase ahora que U es una transformación unitaria de V sobre V” y 
que 7" = UTU"?. Entonces la igualdad 


Ta = ca 


vale si, y solo si, 
T'Ua = cUa. 


Asi que S es el espectro de T”, y U aplica todo subespacio propio para T sobre 
el correspondiente subespacio para T”. En efecto, por (9-12), se tiene que 


T' = 3 6E,, E, = UE,U”!* 
J 
es la descomposición espectral de 7”. Luego 


KT) = ENC)E, 


= 2 f(c¡)UE,U> 
J 


U (fc )E¡) U- 


UN(T)U=. Y 


Pensando en el análisis anterior, es importante tener presente que el es- 
pectro del operador normal T es el conjunto 


S = [Ca, . . ., cx) 


de valores propios distintos. Cuando T' está representado por una matriz dia- 
gonal en una base de vectores propios es necesario repetir cada valor c, tantas 
veces como la dimensión del correspondiente espacio de vectores propios. 
Esta es la razón del cambio de notación en el siguiente resultado. 


Corolario. Con las hipótesis del Teorema 10, supóngase que T está repre- 
sentado en la base ordenada GB = fa,, ..., a.) por la matriz diagonal D de ele- 
mentos d,, ..., d,. Entonces, en la base 6, [(T) está representada por la matriz 
diagonal f(D) de elementos fíd,), .... f(d,). Si GB" = lx;, ..., 0,) es otra base 
ordenada cualquiera y P es la matriz tal que 


entonces P"*f(D)P es la matriz de f(T) en la base BG". 


Demostración. Para cada índice ¡ existe un único f tal que 1<j¡<k, 
a, pertenece a E¡(V) y d¡ = c;. Luego f(T)a, = f(d¡)a,, para todo i, y 


Da, = 2 Po; 
= E diPijo; 
2 OP) 
= y (DP), z Pa'as 


= z (PADP) y ¡Qs ¡ 
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Se sigue de este resultado que pueden formarse ciertas funciones de una 
matriz normal. Pues supóngase que A es una matriz normal. Entonces existe 
una matriz inversible P, en realidad una matriz unitaria P, tal que PAP"! es 
diagonal, sea D con elementos d,, ..., d,. Sea f una función compleja que 
se pueda aplicar a d,, ..., d, y sea f(D) la matriz diagonal con elementos 
Md). ..., fid,). Entonces P7*f(D)P es independiente de D y es una función 
de A en el siguiente sentido: Si O es otra matriz inversible tal que Q4Q”! sea 
una matriz diagonal D”, entonces f puede aplicarse a los elementos de la dia- 
gonal de D', y 


PfK(DJP = QÍF(DJO. 
Definición. En las condiciones anteriores, f(A) se define como P”"*f(DYP. 
La matriz f(A) puede ser también caracterizada de un modo distinto. Al ha- 
cerlo se enuncian sin demostración algunos de los resultados sobre matrices 


normáles que se obtienen al formular los teoremas con matrices análogos de 
los teoremas anteriores. 


Teorema 11. Sean A una matriz normal y C,, ..., C, las distintas raíces 
complejas de det (x1 — A). Sea 


x—C; 
j+iNG — Cj 


y E, = e¡(A) (1 < i < k). Entonces E,E, = O cuando ¡4 j, Ef = E,, E? = E,, y 
Il = E, +0: +£;,. 


Si f es una función compleja cuyo dominio incluye a C,, ..., Cx, entonces 
HA) = JlO JE, ++: + fc, JEz; 
en particular, A =C E, +: +C,E,. 


Recordemos que un operador en un espacio producto interior V es no ne- 
gativo si T es autoadjunto y (Toja) > O para todo a de V. 


Teorema 12. Sea T un operador diagonalizable normal sobre un espacio 
producto interno de dimensión finita V. Entonces T es autoadjunto, no negativo, 
o unitario, según que cada valor característico de T sea real, no negativo, o de 
-valor absoluto 1. 


Demostración. Supóngase que T tenga descomposición espectral T = 
CE, ++: 4+C,E,, entonces T* =€,E, + :::* + €,E,. Decir que T es auto- 
adjunto es decir que T = T*, o 

(Ca — TYEL+ +++ + (c+ — GYEs = 0. 


Valiéndose de que E,E;, = O para i 4 j y de que ningún E, es el operador cero, 
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se ve que T' es autoadjunto si, y solo si, c; = €, j= 1,..., k. Para distinguir 
los operadores normales que son no negativos, obsérvese que 


k k 
(Tala) ( Y c¡Eja| Y Esa) 
j=1 j 


i=1 


= 2 2 ci( ja Esa) 
113 
= 2 €;]|[E;al|?. 


Hemos usado el hecho de que (E,a|E,a) = O para ¡ + ¡. De esto resulta que 
la condición (Tala) > O se satisface si, y solo si, c; > O para todo j. Para dis- 
tinguir los operadores unitarios obsérvese que 


TT* = c¡61É, + e... CxCx E; 
[co[?E, + + lc ?Es. 


Si- TT* = [, entonces '= |c,|?E, + :- + + |cy]*E,, y operando con E), 
Ej = lc,/?E,. 


Como E; + 0, se tiene que [c;|? = 1, o |c,| = 1. Recíprocamente, si [c;|? = 1 
para cada j, es evidente que 77* = I. ] 


Es importante hacer notar que éste es un teorema sobre operadores norma- 
les. Si T es un operador lineal general sobre V, que tiene valores propios reales, 
no se sigue que 7 sea autoadjunto. El teorema dice que si 7 tiene valores propios 
reales y si 7 es diagonalizable y normal, entonces T es autoadjunto. Un teorema 
de este tipo sirve para reforzar la analogía entre la operación de adjunción y 
el procesa de formar el conjugado de un número complejo. Un número com- 
plejo z es real o de valor absoluto 1 según que z = z, o zz = 1. Un operador 
T es autoadjunto o unitario según que 7 = T* o TT* = I. 

Se demostrarán ahora dos teoremas análogos de las dos afirmaciones si- 
guientes: 


(1) Todo número no negativo tiene una única raíz cuadrada no negativa. 

(2) Todo número complejo se puede expresar en la forma ru, con r no 
negativo y lu] = 1. Esta es la descomposición polar z = re'” de los números 
complejos. 


Teorema 13. Sean V un espacio producto interno de dimensión finita y T un 
operador no negativo sobre V. Entonces T tiene una única raíz cuadrada no nega- 
tiva. esto es, existe un operador no negativo N, y solo uno, de V tal que N? = T. 


Demostración. Sea T =C,E, +: + C;E, la descomposición espectral 
de T. Por el Teorema 12, todo c, > 0. Si c es cualquier número real no negativo, 


sea ./c la raíz cuadrada no negativa de c. Entonces, conforme al Teorema 11 


y a (9-12), N = JT es un operador diagonalizable normal bien definido sobre 
V. Es no negativo por el Teorema 12 y, por un cálculo obvio, N? = T. 
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Ahora sea P un operador no negativo sobre Y tal que P? = T. Sea demos- 
trar que N = P. Sea 


P = dF, + --- + d,F, 


la descomposición espectral de P. Entonces d, > O para todo j, pues P es no 
negativo. De P? = T se tiene 


T =P, + --- + d;F,. 


Ahora F,, ..., £; cumple las coridiciones [= F, + -:** + F,, FF, =0 para 
i + j, y ningún F, es 0. Los números df, .. ., d? son distintos, ya que números 
no negativos distintos tienen raíces cuadradas distintas. Por la unicidad de la 
descomposición espectral de T, se tiene r = k y (si acaso por reordenación) 
F, = E,, dí =C;. Así que P= N. |] 


Teorema 14. Sea V un espacio producto interno de dimensión finita y sea 
T un operador lineal cualquiera sobre V. Entonces existen un operador unitario 
U sobre V y un operador no negativo N sobre V tales que T = UN. El operador 
N no negativo es único. Si T es inversible, el operador U es también único. 


Demostración. Supóngase que T = UN, donde U es unitario y N es no 
negativo. Entonces T* = (UN)* = N*U* = NU*, Asi T*T = NU*UN=N?. 
Esto muestra que N está univocamente determinado como la raíz cuadrada 
no negativa del operador no negativo T*T. 

De modo que para comenzar con la demostración de la existencia de U y 
de N, se usa el Teorema 13 para definir N como la única raíz cuadrada no ne- 
gativa de T*T. Si T es inversible, también lo es N, pues 


(NalNa) = (N?ala) = (T*Taja) = (TafTa). 


En este caso se define U = TN”? y se demuestra que U es unitario. Ahora bien, 
U* = (TN 2)Y* =(N 7 %)*T* = (N*) 1T* = N"*T*. Así que 


UU* = TNANT* 
T(N=5) 2 * 
T(N3” Y 
T(T*T)T* 
TT(T*)AT* 
= 1 


ll 


y U es unitario. 

Si T no es inversible hay que proceder en forma más laboriosa para definir 
U. Primeramente se define U sobre la imagen de N. Si a es un vector de esta ima- 
gen, por ejemplo, a = Nf. Se define Uxa = Tf, motivado por el hecho de que 
se quiere que UNf$ = Tff: Debe verificarse que U está bien definido sobre la 
imagen de N; es decir, si Nf$' = Nf; entonces Tf" = Tf. Se verificó anterior- 
mente que ||Ny]|1? = ||7y]]? para todo y en V. Así, con y = B| — ff” se ve que 
N(B — BY) =0 si, y solo si, 7(B = B')= 0. Con lo que U está bien definido 
sobre la imagen de N y es evidentemente lineal donde está definido. Ahora 
bien, si W es la imagen de N, se definirá U sobre W!. Para ello se necesita la 


338 Algebra lincal 


siguiente Observación. Como T' y N tienen el mismo espacio nulo, sus imágenes 
tienen la misma dimensión. Así W? tiene la misma dimensión que el comple- 
mento ortogonal de la imagen de 7. Por tanto, existe un isomorfismo (de espacio 
producto interno) U,¿ de W* sobre T(V)*. Ahora se ha definido U sobre W, 
y se define U sobre W* como U,. 

Se repite la definición de U. Como V = W Q W?, todo a de V está expre- 
sado univocamente en la forma a = Nf + y, donde Nf está en la imagen W de 
N y y está en W?. Se define 


Ua = Tf + Uy. 


Este U es evidentemente lineal, y se verificó anteriormente que está bien de- 
finido. Así, pues,” 


(UalUa) = (TB + Us|TB + Uor) 
= (T6B|T8) + (Uyy]| Uoy) 
= MENO) + (iv) 
= (aja 


y entonces U es unitario. También tenemos que UNf£ = TB para todo f. | 


T = UN se le llama una descomposición polar de 7. Por cierto que no se 
le puede llamar la descomposición polar, ya que U no es único. Aun cuando 
T sea inversible, con lo que U es único, tenemos la dificultad de que U y N pueden 
no conmutar. Ciertamente, conmutan si, y solo si, 7 es normal. Por ejemplo, 
si T = UN = NU, con N no negativo y U unitario, entonces 


TT* = (NUNNU)* = NUU*N = N? = TT. 


El operador general T tendrá también una descomposición 7 = N,U, con ÑN, 
no negativo y U, unitario. Aqui N, será la raíz cuadrada no negativa de TT*. 
Se puede obtener este resultado aplicando el teorema que se acaba de demostrar 
al operador 7*, y tomando luego adjuntos. 

Pasamos ahora al problema de qué se puede decir respecto a la diagona- 
lización simultánea de familias conmutativas de operadores normales. Para 
este propósito es adecuada la siguiente terminología. 


Definiciones. Sea $ una familia de operadores sobre un espacio producto 
interno V. Una función r sobre Y, con valores en el cuerpo F de los escalares, se 
llamará una raíz de $ si existe un a no nulo de V tal que 


Ta = r(Do 
para todo T de S%. Para cualquier función r de Y en F, sea V(r) el conjunto de todos 


los a de V tales que Toa = r(T)a para todo T en Y. 


Entonces V(r) es un subespacio de V y r es una raíz de $ si, y solo sí, V(r) 4 0. 
Todo x no nulo de V(r) es simultáneamente un vector propio para todo 7' de $. 


Teorema 15. Sea Y una familia conmutativa de operadores normales diago- 
nalizables en un espacio producto interno de dimensión finita V. Entonces Y tiene 
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solo un número finito de raices. Sir,.... 1, son las raices distintas de Y, entonces 


(1) V(r,) es ortogonal au V(r;) cuando ¡4 j, y 
(mM) V=V(r,)O0: 0 Vt,). 


Demostración. Supóngase que r y s son raíces distintas de Y. Entonces 
existe un operador 7 en $ tal que r(T') 4 s(7). Como los vectores propios que 
corresponden a valores propios distintos de T son necesariamente ortogonales. 
se sigue que V(r) es ortogonal a V(s). Como V es de dimensión finita. esto 1m- 
plica que $ tiene a lo más un número finito de raíces. Sean r,, ..., r, las raíces 
de $. Supóngase que (T,. ..., T,,, es un subconjunto maximal de Y lineal- 
mente independiente y sea 


(Eu En, - - J 
la descomposición de la identidad definida por 7; (l < ¡ < m). Entonces las 


proyecciones £,, forman una familia conmutativa, pues toda E;; es un polinomio 
en Ty T¡. .... T, conmutan entre sí. Como 


IT = (2 Ei) (Q Ej) ++: (E Emin) 
3 32 Jm 


todo vector x de V puede escribirse en la forma 


(9-13) qa = > Er Ho, ... Emjm0t. 

Mr-. 
Supóngase que j,. .. .. j, son los índices para los que f = E, E);,*** Em;, 0. 
Sea 


B; - (CI E nin) a. 


ni 
Entonces ff = E;;¡f$,; luego existe un escalar c, tal que 
T 8 = CiB, 1 < ¿ < m. 


Para cada T en $ existen escalares únicos h, tales que 


T= ST. 
q] 
Asi Tp = Zb,T,B 
= (2 bici) B. 


La función 7 — Y b,c, es evidentemente una de las raíces, por ejemplo, r, de 3, 


t 
v ff está en V(r;). Por tanto, cada término no nulo en (9-13) pertenece a uno 
de los espacios V(r,), .... V(r,). Se sigue que I' es la suma directa ortogonal 
de Vir) .... Vir). |] 


Corolario. En la hipótesis del teorema, sea P; la proyección ortogonal de 
Il" sobre Vir;), (| << k). Entonces P¡P; = 0Osiiz24J. 


ITI=P,+:::+P 
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y todo T de Y puede ser escrito en la forma 
j 


Definiciones. La familia de las proyecciones ortogonales 1P,. .... Py; se 
llama descomposición de la identidad determinada por $ y (9-14) es la descomposición 
espectral de 7 según esta familia. 


Aunque las proyecciones P,, ..., P, del corolario anterior están asocia- 
das canónicamente con la familta Y, no están generalmente en $, ni son siquiera 
combinaciones lineales de operadores de $; sin embargo, veremos que se pue- 
den obtener por la formación de ciertos productos de polinomios en elemen- 
tos de $. 

Para el estudio de una familia de operadores en un espacio producto interno 
suele ser provechoso considerar el álgebra autoadjunta generada por la familia. 


Definición. Un álgebra autoadjunta de operadores sobre un espacio producto 
interno V es un subálgebra lineal de L(V, V) que contiene el adjunto de cada uno 
de sus elementos. 


Ejemplo de álgebra autoadjunta es el mismo L£(V, Y). Como la intersec- 
ción de cualquier colección de álgebras autoadjuntas es a su vez un álgebra 
autoadjunta, la siguiente terminología tiene sentido. 


Definición. Si Y es una familia de operadores lineales sobre un espacio pro- 
ducto interno de dimensión finita, el álgebra autoadjunta generada por $ es la 
menor álgebra autoadjunta que contiene a Y. 


Teorema 16. Sea Y una familia conmutativa de operadores diagonalizables 
normales sobre un espacio producto interno de dimensión finita V y sea R el ál- 
gebra autoadjunta generada por $ y el operador identidad. Sea *P,, .... P,, la 
descomposición de la identidad definida por Y. Entonces QU es el conjunto de todos 
los operadores sobre V de la forma 


k 
(9-15) T = z c¡P; 
j= 


donde C,. .... e, son escalares arbitrarios. 


Demostración. Sea ( el conjunto de todos los operadores sobre Y de la 
forma (9-15). Entonces (€ contiene al operador identidad y el adjunto 


T* = 2 CP 
J 


para cada uno de sus elementos. Si T = E c;¡P, y U = E dP,, entonces pará 
poo” j 


todo escalar « 


aT + U = Y (ac + d)P, 
J 
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TU = E ca;P.P, 
2,3 
= 2 CP; 
Jj 


= UT. 


Asi que € es un álgebra autoadjunta conmutativa que contiene a $ y al opce- 
rador identidad. Por tanto, € contiene a (2. 

Ahora sean r,, ..., ri todas las raices de $. Entonces, para todo par de 
dices (i, n) con ¡ + n, existe un operador 7;, en Y tal que r;(7;,) 4 r,(T;,). 
Sca Gin = FAT) — "nt Zin) Y Din = "nl Zin). Entonces el operador lineal 

Q;= IM an (Tin — dinI) 

ny 
es un elemento del álgebra (2. Se demuestra que O, =P, (1 < ¿<k). Para 
cllo, supóngase que j + í y que a es un vector arbitrario en V(r;). Entonces 

Ta = ri(Tij)a 

= b;ja 

de modo que (7;, = b;¡1)a = 0. Como todos los factores en Q, conmutiun, se 
sigue que Q,a = 0. Luego Q, coincide con P, en V(r;) si ¡ + í. Supóngase ahora 
que a es un vector de V(r;). Entonces T;, a = r;(T,, JA. y 


am tT in — binl)a = an rd T in) — ra(T im)]a = a. 
Así, pues, Q,a = a y Q, commcide con P, en V(+;¡): por tanto, O; = P, para / 
Il, ..., k. De lo cual se sigue que GQ = €. ] 


El teorema muestra que el álgebra G es conmutativa y que cada elemento 
de (£ es un operador normal diagonalizable. Se demuestra a continuación que (t 
tiene un solo generador. 


Corolario. Con las hipótesis del teorema existe un operador T en Q tal que 
todo elemento de G es un polinomio en T. 


k o 
Demostración. Sea = Y t¡P, COn fy, ..., f, son escalares distintos. Entonces 
j=1 
k 
Tr = 3 GP, 
I= 
para n=1,2,... $1 
8 
f= Y az" 
. n=1 
se sigue que 
hd 8 k 
NT)= Za, T"= Y Y ar, 
n=1 n=1j=1 
k 8 
= 2 ( > ant) P; 
¿=1 Wn=1 
k 
= 2 f(,)P, 
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Dado un , 
U = 2, ciP; 
J=1 
arbitrario en G. existe un polinomio f tal que f(t¡) = c; (1 < / < k) y, para 
cualquier tal f U= f(T7). 


Ejercicios 


l. Dar una definición razonable de una matriz n x n no negativa y demostrar luego que 
tal matriz tiene una única raiz cuadrada no negativa. 


2. Sea A una matriz n x n con elementos complejos tal que 4* = — 4 y sea B = e”, 
Demostrar que 


la) det B= e" 4; 
(b) B*F=c *: 
(c) B es unitaria. 


3. Si U y T sor operadores normales que conmutan, demostrar que U + T y UT son 
normales. 


4. Sea T un operador lineal sobre un espacto producto interno de dimensión finita V. 
Demostrar que las diez siguientes afirmaciones respecto a T son equivalentes: 

(a) T es normal. 

(b) ||Txl] = |]P*x]| para todo x en 5. 

(c) T= T, + ¿T,. donde T, y T, son autoadjuntos y 71,T, = T,T,. 

(d) Si x es un vector y c un escalar de modo que Ta = cx, entonces T%*x = €x. 

(e) Existe una base ortonormal de Y formada por vectores propios para T. 

(f) Existe una base ortonormal 03 tal que [7] es diagonal. 

(g) Existe un polinomio g con coeficientes complejos tal que T* = e(T). 

(h) Todo subespacio invariante por T es también invariante por 7*. 

(1) 7 = NU, donde N es no negativo, U es unitario, y NÑ conmuta con U. 

(3) T=0 T, +++ +4, E, donde I= E, + >: + E,. E,E,¿=0 para ¡4 j. y Ej = 
E, = Ef. 


5. Usar el Ejercicio 3 para mostrar que cualquier familia conmutativa de operadores nor- 
males (no necesariamente diagonalizables) en un espacio producto interno de dimensión 
finita genera un álgebra autoadjunta conmutativa de operadores normales. 

6. Sean Y un espacio producto mterno complejo de dimensión finita y [' un operador 


» 


unitario sobre | tal que Uxz = 2 implique x = 0. Sca 


.(1+2) 
J(2) = 1 (12) 2% | 
y demostrar que 
la) NU) = (+ UML — U) ?. 
(b) MU) es autoadjunto. 
(c) para todo operador autoadjunte 7 sobre Y”, cl operador 


U = (7 — UNT +17 
es unitario y tal que 7 = MU). 
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7. Sca Y el espacio de las matrices complejas » x n con el producto interno 
(AIB) = tr (AB*). 


Se B es un elemento de Y, sean La, Ra y Tg los operadores lineales sobre Y definidos por 
(a) Ls(A) = BA. 
(b) Rs(A) = AB. 
(c) TH A) = BA — AB. 
Considerar las tres familias de operadores que se obtienen al hacer variar B sobre todas 
las matrices diagonales. Demostrar que cada una de estas familias es un álgebra autoadjunta 
conmutativa y hallar sus descomposiciones espectrales. 


$8. Si Bes un elemento del espacio producto interno del Ejercicio 7, hacer ver que /¿ es equi- 
valente unitariamente a Ra. 


Y. Sean Y el espacio producto interno del Ejercicio 7 y G el grupo de matrices unitarias 
de V. Si B está en G, sea Cg el operador lineal sobre Y definido por 
Cs(A) = BAB”. 
Demostrar que 
la) Cg es un operador unitario en V: 
(b) Cp a, = Cp Cb.: 
(c) no existe una transformación unitaria U en Y tal que 


ULÍBU”" = Ca 
para todo B de G. 


10. Sean $ una familia cualquiera de operadores lincalcs sobre un espacio producto in- 
terno de dimensión finita Y y Q el álgcbra autoadjunta generada por Y. Demostrar que 
(a) toda raíz de (Q define una raiz de $; 
(b) toda raiz r de Q es una función lineal multiplicativa sobre A, es decir, 


r(T)yr(U) 
cr(T) + r(U) 


r(TU) 
r(cT + U) 


para todo T y U de G y todo escalar c. 


!l 


Ml. Sea F una famila conmutativa de operadores diagonalizables normafes sobre un 
espacio producto interno de dimensión finita Y y sea Q el álgebra autoadjunta generada 
por $ y el operador identidad /. Demostrar que toda raiz de (2 es distinta de O y que para 
toda raíz r de $ existe una raíz única s de Q tal que (7) = r(T) para todo T' de Y. 


12. Sean $ una familia conmutativa de operadores diagonalizables normales en un es- 
pacio producto interno de dimensión finita V y (R, el álgebra autoadjunta generada por $. 
Sea Q el álgebra autoadjunta generada por $ y el operador identidad / Demostrar que 

(a) Q es el conjunto de todos los operadores sobre V de la forma c/ + T, donde « es 
un escalar y 7 un operador en Go. 

(b) Existe a lo más una raíz r de GQ tal que r(T) = O para todo T de Ro. 

(c) Si una de las raíces de (R es 0 sobre Q,. las proyecciones P,,..., P, en la descom- 
posición de la identidad definida por $ pueden ser rotuladas mediante índices de tal modo 
que (, conste de todos los operadores sobre V de la forma 


k 
T= Y c¡P, 


J=2 
donde C,, ..., €, son escalares arbitrarios. 
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(d) A = GR, si, y solo si, para cada raíz r de (% existe un operador / en A, tal que 
HT) 40. 


9.6. Otras propiedades de los 
operadores normales 


En la Sección 8.5 se han expuesto las propiedades básicas de los operadores 
autoadjuntos y normales usando el método más simple y directo posible. En 
la Sección 9.5 se consideraron varios aspectos de la teoría espectral. Aqui de- 
mostraremos algunos resultados de naturaleza más técnica y que se refieren 
principalmente a operadores normales sobre espacios reales. 

Se comenzará demostrando una versión más precisa del teorema de des- 
composición prima del Capítulo 6 para operadores normales. Será válido para 
ambos casos el real y el complejo. 


Teorema 17. Sea T un operador normal sobre un espacio producto interno 
de dimensión finita V. Sea p el polinomio minimal para T y pi. ..., py sus dis- 
tintos factores primos mónicos. Entonces cada p, tiene multiplicidad 1 en la fac- 
torización de p y tiene grado 1 o 2. Supóngase que W; es el espacio nulo de pT). 
Entonces 


t 

(11) V=W 0: :0W. 
(111) W) es invariante por T y p; es el polinomio minimal para la restricción 
de Ta W,;; 


j 
(1v) para todo ¡ existe un polinomio e, con coeficientes en el cuerpo de los 
escalares tal que e(T) es la proyección ortogonal de Y sobre W,. 


(1) W)j es ortogonal a W¡.siiF Jj; 


En la demostración usaremos ciertos hechos básicos que sentaremos como 
lemas. 


Lema 1. Sea N un operador normal sobre un espacio producto interno W. 
Entonces el espacio nulo de N es el complemento ortogonal de su imagen. 


Demostración. Supóngase que (x|Nf) = 0 para todo f de W. Entonces 
(N*a|f) = 0 para todo f; luego N*xa = 0. Por el Teorema 19 del Capítulo 8 
esto implica que Na = 0, Recíprocamente, si Na = O entonces N*x = 0 y 


(N*a]6) = (a[N8) = 0 
para todo f de W. | 


Lema 2. Si N es un operador normal y x es un vector tal que N?a = 0, 
entonces Na = 0. 


Operadores sobe vapuctón producto nterno 385 


Demostración. Supóngase que N sea normal y que N%a% = 0. Entonces 
Nx está en la imagen de N y también en el espacio nulo de N. Por el Lema 1, 
esto implica que Na = 0. | 


Lema 3. Sean T un operador normal y f cualquier polinomio con coeficien- 
tes en el cuerpo de los escalares, Entonces f(T' es también normal. 


Demostrución. Supóngase que f = dy + ax + *** + ax”. Entonces 


KT) = ad +aqT ++. + AnT'” 


HT) = al + a 78 + a.(1*)”. 
Como T*T = TT*, se sigue que f(T) conmuta con f(T)*. | 


Lema 4. Scan T un operador normal y f, g polinomios primos relativos 
con coeficientes en el cuerpo de los escalares. Supóngase que a y P.son vectores 
tales que Ta = 0 y g(T)B = 0. Entonces (a f$) = 0. 

Demostración. Existen polinomios « y b con coeficientes en el cuerpo de 
los escalares tales que «af + bg = 1. Así 


ADT) + 0D) = 1 
y x= g(T)h(T)a. Se sigue que 
(18) = (g(TI5(D)al8) = (b(Tjalg(T)*8). 


Por suposición, g(T)f = 0. Por el Lema 3, e(7) es normal. Por tanto. por el 
Teorema 19 del Capítulo 8, g(T)*f = 0; luego (x|f) = 0. NM 


Demostración del Teorema 17. Se recuerda que el polinomio minimal 
para T es el polinomio mónico de grado menor entre todos los polinomios f 
tales que f(T) = 0. La existencia de tales polinomios se desprende de la supo- 
sición de que Y es de dimensión finita. Supóngase que un factor primo p, de p 
está repetido. Entonces p = pg para algún polinomio g. Como p(T) = O, se 
sigue que 

(p(T)?g(T)a = 0 


para todo a de V. Por el Lema 3, p;(T') es normal. Así, el Lema 2 implica que 
p(T)ig(T)]a =0 
para todo a de V. Pero esto contradice la suposición de que p tiene el menor 
grado entre todos los f tales que f(T') = 0. Por tanto, p = p, ***Px. Si V es 
un espacio producto interno complejo, todo p; es necesariamente de la forma 
Pj= 7 Cj 
con c; real o complejo. Por otro lado, si Y es un espacio producto interno real. 
entonces py; = x;— c, con cen Ro 
pj = (12 — c)(x — E) 
donde « cs un número complejo no real. 
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Sea ahora f; = p'p;. Entonces, como f;. .... f¿son primos relativos. ex1s- 
ten polinomios g, con coeficientes en el cuerpo de los escalares tales que 
(9-16) 1 = 2495. 

J 


Indicamos brevemente cómo se pueden construir estos g;. Si p,= Xx —C,. 
entonces fi(c;) + O, y para g, se toma el polinomio escalar 1,/f;(c;). Sí todo 
polinomio es de esta forma, los f;g,son la familia de los polinomios de Lagrange 
asociados con los (,, .. ., Cj, y (9-16) es claramente válida. Supóngase que algún 
py = (x— cAíx — e) con c un número complejo no real. Entonces V es un 
espacio producto interno real, y se tiene 

rat, I—c 


+ 


S S 








gi = 
donde s = (c — €)f;(c). Entonces 


o (6 +48)r — tos + 25) 
9j s5 
con lo que g, es un polinomio con coeficientes reales. Si p es de grado n. en- 
tonces 


l—- 2 Í59, 
j 


es un polinomio con coeficientes reales de grado n — | a lo más; además. se 
anula en cada una de las » raíces (complejas) de p” y. por tanto, es idéntica- 
mente 0. 

Sea ahora x un vector arbitrario de V. Entonces, por (9-16) 


a = 2 Dg Ta 


y como pj(T)f¡(T') = O, se sigue que f¡(T)e¡(T)x está en W, para cada /. Por 
el Lema 4, W; es ortogonal a W, siempre que ¿ + /. Por tanto, cs la suma di- 
recta ortogonal de W,. .... W,. Si f es cualquier vector en 14”, entonces 


PAT)T8 = Tp(T)p = 0; 


así que W; es invariante por 7. Sea T; la restricción de Ta W;. Entonces p(T,)=0. 
con lo que p, es divisible por el polinomio minimal para 7,. Como p, es irredu- 
cible sobre el cuerpo de los escalares, se sigue que p, es el polinomio minimal 
para T,. 

Sea ahora e; = fig; y E, = e¡(T). Entonces para todo vector x de I Ejx 
está en W,, y 

a —= 2 Ea. 
J 


Asi,a — Esa = 2 Eja; como W, es ortogonal a MW, si j = ¡. esto implica que 
¡Ai 

1 — E,a está en W,*. Se deduce ahora. del Teorema 4 del Capitulo 8. que £, us 

la proyección ortogonal de Y sobre W,. | 


Definición. Los subespucios W; (1 < ¡ < k) se llaman componentes primos 
de V según 7. 
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Corolario. Sean T un operador normal sobre un espacio producto interno 
de dimensión finita V y W,,..., W, los componentes primos de V según T. Supón- 
gase que W es un subespacio de V invariante por T. Entonces 


W=YxWnw. 
J 


Demostración. Evidentemente W contiene a Y W (7 W;. Por otro lado, 


J 
W, que es invariante por 7, es invariante por todo polinomio de 7. En particu- 
lar, W es invariante por la proyección ortogonal E; de V sobre W;. Si a está en 
W, se sigue que Eja está en W fr W, y, al mismo tiempo, que a = 2 Ea. Por 


tanto, W está contenido en 2W(fW. | 
j 


El Teorema 17 muestra que todo operador normal 7 sobre un espacio pro- 
ducto interno de dimensión finita está dado canónicamente por un número 
finito de operadores normales 7; definidos sobre los componentes primos W; de 
V según T, cada uno de cuyos polinomios minimales es irreducible sobre el 
cuerpo de los escalares. Para completar el conocimiento de los operadores 
normales es necesario estudiar Operadores normales de este tipo especial. 

Un operador normal cuyo polinomio minimal es de grado | es obviamente 
apenas un múltiplo escalar de la identidad. Por otro lado, cuando el polinomio 
minimal es irreducible y de grado 2, la situación es más complicada. 


Ejemplo 1. Supóngase que r > O y que U sea un número real no múltiplo 
entero de x.. Sea T el operador lineal sobre R? cuya matriz en la base ortonormal 
canónica es 

A=5 cost)  —sen o) 
sen 0 cos 6 
Entonces T' es un múltiplo escalar de una transformación ortogonal y, por 
tanto, normal. Sea p el polinomio propio de T, entonces 


p = det (1x1 — A) 
= (1 — reos 0)? + r? sen? 6 
= x — 2rcos Ox + 7?, 


Sea a =rco0s0, b= rsenU y e = a + ib. Entonces b 4 0, e = re”? 


a —b 
4 = F o! 
y p= (x — cXx — c(). Luego p es irreducible sobre R. Como p es divisible por 


el polinomio minimal de 7, se sigue que p es el polinomio minimal. 
Este ejemplo sugiere el siguiente recíproco. 


Teorema 18. Seun T un operador normal sobre un espacio producto interno 
real de dimensión finita V y p su polinomio minimal. Supóngase que 


p=(x-— a + b? 
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donde a y b son reales y b 0. Entonces existe un entero s > 0 tal que p" es el 
polinomio propio de T y existen subespacios V¡, ..., Vo de Y tales que 


(1) V; es ortogonal a V, cuando i + j, 
(1) V=VY,0:::OV;; 
(11) cada V; tiene una base ortonormal |a;, By con la propiedad de que 
To; = ada; + bP; 
En otras palabras, si r =./a? + b? y 0 se elige de modo que u = rcos 6 
y b= rsen 6, entonces V es una suma directa ortonormal de espacios bidi- 
mensionales V; en cada uno de los cuales T' actúa como «r veces la rotación 


de ángulo 0». 
La demostración del Teorema 18 estará basada en el siguiente resultado. 


Lema. Sean V un espacio producto interno real y S un operador normal 
sobre V tal que S? + I=0. Sea a cualquier vector de V y B| = Sa. Entonces 


S*a = —$f 
(9-17) 

S*f = ax 
(08) =0, y llol] = [18l). 

Demostración. Tenemos que Sa = fB y Sf = S%a = —a. Por tanto, 
0 = |[Sa — pll? + 1188 + all? = 11Sa]]? — 2(Sa]8) + 11811? 
+ 118611? + 2(SBla) + lla]? 

Como S es normal, se sigue que 


0 = |1S*a]|? — 2(S*Bla) + 1811? + |1S*8]1? + 2(5*0]8) + lla]l? 
= [15% + Bl? + 118*8 — od]?. 
Esto implica (9-17); luego 
(a]8) = (S*glg) = (6186) * 


(Bl —a) 
— (08) 


1 


y (a]f$) = O. En forma análoga 
lalI? = (S*gla) = (BlSa) = []6ll?. 


Demostración del Teorema 18. Sea V,, ..., V, una colección maximal 
de subespacios bidimensionales que satisfacen (1) y (11) y las condiciones adi- 
cionales 

T*a; aa; — DB, 
(9-18) 1<j<s. 
1*B, = ba; + af; 


Sea W= V, ++::* + V. Entonces W es la suma directa ortogonal de los 
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Mi. ..., V,. Veremos que W = V. Supóngase que éste no sea el caso. Enton- 
cos W* + (0). Más aún, como (iii) y (9-18) implican que W es invariante por 
T y T*, se sigue que W!? es invariante por T* y T = T** Sea S = b”UT-al). 
Entonces S* = b"*(T* — al), S*S = SS* y W!* es invariante por S y S*. 
Como (T — al? + b*I = 0, se sigue que S? + 7 = 0. Sea a cualquier vector 


de norma 1 en W* y sea ff = Sa. Entonces f está en W? y SfB = —a. Como 
T = al = bS, esto implica que 

Ta = aa + bf 

TB = —ba + af. 


Por el teorema, Sta = —f, S*fB = a. (a]f$) = 0 y [Bl] = 1. Ya que T* = al + 
bS*, se sigue que 


T*a = an 7 bB 
T*B = ba + af. 
Pero esto contradice el hecho de que V,, ..., V, es una colección maximal de 
subespacios que satisfacen (1), (111) y (9-18). Por tanto, W = V, y como 
c—a b A a > 
der | _b za = (xx —a)?+b 


se sigue de (1), (11) y (111) que 
det (11 — T) = [(x — a) + b?J*. | 
Corolario. En las condiciones del teorema, T es inversible y 


T* = (a? + b2)T.. 
Demostración. Como 


B eN a b OS 0 ] 

b all—b al 0 a? + b? 

se sigue de (111) y (9-18) que TT* = (a? + b*)1. Luego T es inversible y T* = 
(a? + 62)". 


Teorema 19, Sea T un operador normal sobre un espacio producto interno 
de dimensión finita V. Entonces cualquier operador lineal que conmuta con T 
también conmuta con T*. Además, todo subespacio invariante por T es también 
invariante por T*. 


Demostración. Supóngase que U es un operador lineal sobre Y que con- 
muta con 7. Sea E, la proyección ortogonal de Y sobre el componente primo 
W;, (1 < ¡<k) de V según T. Entonces E; es un polinomio en T y, por tanto, 
conmuta con U. Así que 


E¡UE, = UE? = UE,. 


con lo que U(W;) es un subconjunto de W,. Sean T; y U;, las restricciones de 
T y Ua W;. Supóngase que /, es el operador identidad sobre W;. Entonces U; 
conmuta con 7;, y si 1, = c;[; es claro que U, también conmuta con Tf = C,1,. 


350 Alevebra lmeal 


Por otro lado, si 7; no es un múltiplo escalar de /,. entonces 7, es inversible y 
existen números reales a; y b; tales que 


Ti = (9 +01)" 


Como U,T,'= T;¡U, se sigue que T; 'U;, = U,T;, '. Por tanto, U, conmuta con 
T* en ambos casos. Ahora T* también conmuta con E, y, por tanto, W, es in- 


variante por T'*. Además. para todo 2 y fi de W, 


(Tjalg6) = (Talé) = (aT*B) = (o]T78). 


Como T*(W);) está contenido en W;, esto implica que 7;* es la restricción de 
T* a W,. Así que 
UT*a, =- T*Ua, 


para todo a, de W;. Como V es la suma de W,, ..., W,, se sigue que 
UT*a = T*Ua 


para todo a de V y, por tanto, que U conmuta con T*. 
Supóngase ahora que W es un subespacio de V invariante por T y sea Z, = 
W py w;. Por el corolario del Teorema 17, W=Y Z),. Así que es suficiente 


] 
demostrar que todo Z; es invariante por 77. Esto es obvio si 7; = c;/. Cuando 
éste no es el caso, 7; es inversible y aplica Z;en, y en consecuencia sobre, Z;. 
Asi, T, '(Z;¡) = Z;. y como 


Tj = (aj + d3)T, >. 


se concluye que T*(Z;) está contenido en Z,, para todo j. | 


Supóngase que 7 es un operador normal en un espacio producto interno 
de dimensión finita V. Sea W un subespacio invariante por 7. Entonces el co- 
rolario anterior muestra que W es invariante por 7*. De esto se sigue que W* 
es invariante por 7** = T (y, en consecuencia, también invariante por T*). 
Usando este hecho se puede fácilmente demostrar la siguiente versión más 
reforzada del teorema de descomposición cíclica, dado en el Capítulo 7. 


Teorema 20. Sea T un operador lineal normal en un espacio producto in- 
terno de dimensión finita V (dim V > 1). Entonces existen r vectores no nulos 
A, ..., 2% en V con los respectivos T-anuladores ey, ...., e, tales que 


(1) V=Z(U);TDO-:::0 Za; T); 
(11) sil<k<r-— 1, entonces €,,¡ divide a es; 
(m) Za; T) es ortogonal a Z(9%,; T) si j + k. Además, el entero r y los 
anuladores e,. -.., e, están univocamente determinados por las condiciones (i) y 
(1) y por el hecho de que ningún x2, es 0. 


Corolario. Si A es una matriz normal de elementos reales (complejos), en- 
tonces existe una matriz real ortogonal (unitaria) P tal que P”*AP está en forma 
canónica racional. 
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Se sigue que dos matrices A y B son equivalentes unitariamente st, y solo si, 
tienen la misma forma racional; A y B son equivalentes ortogonalmente si 
tienen elementos reales y la misma forma racional. 

Por otro lado, hay un criterio más simple que la equivalencia unitaria de 
las matrices normales y los operadores normales. 


Definiciones. Sean V y V' espacios producto interno sobre el mismo cuerpo. 
Una transformación lineal 
U:V>oV' 
se dice una transformación unitaria si aplica V sobre V' y preserta los productos 
internos. Si T es un operador lineal sobre V y T” un operador lineal sobre V”, en- 
tonces T es unitariamente equivalente au T”, si existe una transformación unitaria 
U de V sobre V” tal que 
UTU7* = T". 

Lema. Sean V y V espacios producto interno de dimensión finita sobre el 
mismo cuerpo. Supóngase que T es un operador lineal sobre V y que T” es un ope- 
rador lineal sobre V'. Entonces T es unitariamente equivalente a T” sí, y solo si, 
existen una base ortonormal GB de V y una base ortonormal 63" de V' tal que 


[(Tlg - [71 g- 

Demostración. Supóngase que hay una transformación unitaria U de V 
sobre V” tal que UTU7' = T'. Sea B = [x%,, ..., %,) cualquier base (orde- 
nada) ortonormal de V. Sea x; = Ua, (1 < ¡ < n).-Entonces 03" = (%. ..., %,) 
es una base ortonormal de V', y haciendo 

n 
Ta, = Y Á j0x 
k=1 
se ve que 
To = UTa, 
— 2 Ar Uos 


—= Zz Ajo 


Luego [T]g = 4 = [7 ]g- 
Reciprocamente, supóngase que existen una base ortonormal 63 de V y una 
base ortonormal 63" de V" tales que 


[Tle = [770 
y sea A = [7]. Supóngase que 03 = (%1. .... A y que 63 = (%..... 


Sea U una transformación lineal de V en V' tal que Ux, ="x, (1 < ¡ < mn). Enton- 
ces U es una transformación unitaria de V sobre V”, y 


UTUTIa, = UToa, 
= Uy A yj0s 
k 


= > Á y 0%. 
k 
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Por tanto, UTU"*a; = a (1 <¡< am), y esto implica que UTU * = 1”, | 


Se sigue inmediatamente de este lema que los operadores unitartamente 
equivalentes en espacios de dimensión finita tienen el mismo polinomio propio. 
Para operadores normales el recíproco es válido. 


Teorema 21. Sean V y V' espacios producto interno de dimensión finita 
sobre el mismo cuerpo. Supóngase que T es un operador normal sobre V y que 
T" es un operador normal sobre V'. Entonces T es umtariamente equivalente a T' 
si, y solo si, T y T'" tienen el mismo polinomio propio. 


Demostración. Supóngase que T y T” tienen el mismo polinomio propio f. 
Sean W; (1 < j < k) los componentes primos de V según 7 y T, la restricción 
de Ta W,. Supóngase que /; sea el operador identidad sobre W,. Entonces 


k 
f = + det (11; — T)). 
Jj= 
Sea p;, el polinomio minimal de 7;. Si p; = x — c, es evidente que 


det (21; — T,) = (x — C,)* 


donde s; es la dimensión de W;. Por otro lado, si p; = (x — aj)? + bj con aj. b, 
reales y b, + 0, entonces se sigue del Teorema 18 que 


det (11, — T,) = py 
donde en este caso 2s; es la dimensión de W;. Por consiguiente, f = II py. 


Se puede ahora calcular también f por el mismo método usando los compo- 
nentes primos de V” según 7”. Como pj, ...., Pi SON primos distintos, se sigue 
de la unicidad de la factorización prima de f que hay exactamente k componentes 
primos W; (1 < ¡< k) de V” según T” y que éstos pueden ser rotulados con 
índices de tal modo que p, sea el polinomio minimal de la restricción T¡ de T' a 
W;. Si p, = x — C;, entonces T; = Cl; y T; = Cl, donde I; es el operador 
identidad sobre W;. En este caso es evidente que 7; es unitariamente equivalente 
a T;¡. Si p, = (x — ay? + b;, como anteriormente, entonces por el lema y el 
Teorema 20, tenemos nuevamente que 7; es unitariamente equivalente a 7. 
Asi, pues, para todo ¡ existen bases ortonormales Ó, y B; de W, y W¡, respec- 
tivamente, tales que 


[(7,]a, = [T,J0,. 


Sea ahora U la transformación lineal de Y en V* que aplica cada GB, sobre G;. 
Entonces U es una transformación unitaria de V sobre V'tal que UTU”?* = T'. | 
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10.1. Formas bilineales 


En este capítulo se tratará de las formas bilineales sobre espacios vectoriales 
de dimensión finita. El lector observará probablemente una analogía entre 
cierto material y el estudio de los determinantes del Capitulo 5 y de los productos 
internos y de las formas en los Capítulos 8 y 9. La relación entre formas bili- 
neales y productos internos es particularmente estrecha; sin embargo, este 
capítulo no presupone ningún material de los Capítulos 8 o 9. Al lector que 
no esté familiarizado con los productos internos le será provechoso leer la pri- 
mera parte del Capítulo 8 al tiempo que se adentra en el estudio de las formas 
bilineales. 

La primera sección trata del espacio de las formas bilineales sobre un espa- 
cio vectorial de dimensión n. Se introduce la matriz de una forma bilineal en 
una base ordenada y se establece el isomorfismo entre el espacio de las formas 
y el espacio de las matrices n x n. Se define el rango de una forma bilineal y 
se introducen las formas bilineales no degeneradas. La segunda sección estudia 
las formas bilineales simétricas y su diagonalización. La tercera trata las formas 
bilineales antisimétricas. La cuarta estudia el grupo que preserva una forma 
bilineal no degenerada, con especial atención a los grupos ortogonales, a los 
grupos seudoortogonales y a un grupo seudoortogonal particular - -el grupo 
de Lorentz. 


Definición. Sea V un espacio vectorial sobre el cuerpo F. Una forma bilineal 
sobre V es una función f que asigna a cuda par ordenado de vectores a, fi de V un 
escalar fla, f$) de F, y que satisface 
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(10-1) Moa + 2%, [P)= Has. M + Maz, PB) 
flo. cB, + Ba) = <fta, Br) + fo. Ba). 

Si VU x V es el conjunto de todos los pares ordenados de vectores de /V, 
esta definición puede expresarse como sigue: una forma bilineal sobre V es una 
función f de V x V en F que es lineal como función de uno de sus argumentos 
cuando el otro se deja fijo. La función cero de V x Ven T es obviamente una 
forma bilineal. También es cierto que cualquier combinación lineal de formas 
bilineales sobre Y es una forma bilineal. Para demostrarlo es suficiente consi- 
derar combinaciones lineales del tipo cf + g, donde f y g son formas bilineales 
sobre V. La demostración de que «f + g satisface (10-1) es similar a muchas 
otras que se han dado, y por tal razón se omitirá. Todo esto puede resumirse 
diciendo que el conjunto de todas las formas bilineales sobre Y es un subes- 
pacio del espacio de todas las funciones de Y x Ven F (Ejemplo 3, Capítulo 2). 
Se representará el espacio de las formas bilineales sobre V por L£(V, V, PF). 


Ejemplo l. Sea V un espacio vectorial sobre el cuerpo F y sean £, y L, 
formas bilineales en V. Se define f por 


fla, B) = Lila) LA6). 


Si se fija f y se considera a f como función de a, entonces se tiene simplemente 
un múltiplo escalar del funcional lincal £,. Con a fijo, f es un múltiplo escalar 
de L,. Así es claro que f es una forma bilincal en V. 


Ejemplo 2. Sean m y n enteros positivos y F un cuerpo. Sea V el espacio 
vectortal de las matrices m x n sobre F. Sea A una matriz m x m dada sobre F. 
Se define 


SA(X, Y) = tr (X'AP). 


Entonces f, es una forma bilineal sobre V. En efecto, si X. Y y Z son matrices 
m x n sobre F 


falcX + £, Y) = tr [(cX + Z)'4Y] 
tr (CXtA Y) + tr (Z*A Y) 
SaAX, Y) + Sa(Z, Y). 


ll 


Desde luego, se ha hecho uso de que la operación transpuesta y la función traza 
son lineales. Es incluso más fácil demostrar que f, es lineal como función de 
su segundo argumento. En el caso especial n = 1, la matriz AY es 1 x 1. 
es decir, un escalar, y la forma bilineal es solamente 


fa(X, Y) = X'AY 
= 2 2 ÁIUjo 
t 3 


Mostraremos ahora que toda forma bilineal sobre el espacio de las matrices 
m x l es de este tipo; es decir, es f, para cierta matriz m x m, A. 
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Ejemplo 3. Sea F un cuerpo. Queremos hallar todas las formas bilineales 
sobre el espacio F?. Supóngase que f sea una forma bilineal de este tipo. Si 
1= (xi, x,) y B= (y, y,) son vectores de F?, entonces 


f (a, B) f (ze + T2€2, B) 

rifa, B) + 2:f(e, B) 

Tf ler, Ye + Y262) + 2af (ez, Ye + Y2€2) 

ayÍle, €) + aya fe, e) + z2yrflez, 1) + 2242 f (ez, €2). 


Así f está completamente determinada por los cuatro escalares A,; = f(€;, €) por 


fa, B) = Antiy + AvtuYys + Aute + A9T9Ya 
= 2 A ¡¡TYjo 
5,3 


Si X e Y son las matrices de coordenadas de a y f y si A es la matriz 2 x 2 con 
los elementos A(i, j) = A, = f(€¡, €), entonces 
(10-2) fla, B) = X'AY. 


Se observó en el Ejemplo 2 que si A es cualquier matriz 2 x 2 sobre F, enton- 
ces (10-2) define una forma bilineal sobre F?. Se ve que las formas bilineales 
sobre F? son precisamente las que se obtienen de una matriz 2 x 2 como 
en (10-2). 

El análisis del Ejemplo 3 puede generalizarse para describir todas las formas bi- 
lineales sobre un espacio vectorial de dimensión finita. Sea V un espacio vec- 
torial de dimensión finita sobre el cuerpo F y sea 6 = [0,, ..., a, una base 
ordenada de V. Supóngase que f es una forma bilineal en V. Si 


a = m0 +: +Zn0n y B=Y0a +: + YnOn 


son vectores en V, entonces 
fa, 6) - f (2 T¡A;iy 6) 
= Y 1:f(0;, B) 
= if [a 2 yja; 
94(5pu) 
= 2 2 y (ai, aj). 
t J 
Si se hace 4;¡= fa;, 0), entonces 
fla, B) = 2 2 A ty; 


= X'AY 
donde X e Y son las matrices de coordenadas de a y ff en la base ordenada G. 
Así toda forma bilineal en V es del tipo 


(10-3) fía, 8) = [ala A [Bla 
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para alguna matriz n x n sobre F. Reciprocamente, si se tiene cualquier ma- 
triz n x n, A, es fácil ver que (10-3) define una forma bilineal f sobre J', tal 
que As; = f(a,, 25). 


Definición. Sea Y un espacio vectorial de dimensión finita y sea B = 1%,,..., 
2, y una base ordenada de V. Si f es una forma bilineal sobre V, la matriz de f en 
la base ordenada (KB es la matriz n x n, A, con elementos Aj = M9, 2). A veces 
se representará esta matriz por | f|g. 


Teorema 1. Sea V un espacio vectorial de dimensión finita sobre el cuer- 
po F. Para cada base ordenada GB de V, la función que asocia a cada forma bi- 
lineal sobre V su matriz en la base ordenada B es un isomorfismo del espacio 
L(V, V. F) sobre el espacio de las matrices n x n sobre el cuerpo F. 


Demostración. Se observó anteriormente que f—=[f]g es una corres- 
pondencia biunívoca entre el conjunto de las formas bilineales sobre V y el 
conjunto de todas las matrices n x n sobre F. Que es una transformación lineal 
es fácil de ver, ys que 


(cf + gai, aj) = cflas, a,) + gla,, aj) 


para todo í y j. Esto simplemente dice que 


[ef + gla = clfle + [gle. | 


Corolario. SiGB = [x,,...,x2,) es una base ordenada de Vy B* = 'L, 
L, es la base dual de V*, entonces las n* formas bilincales 
fi¡(a, P) = Lo)L;(P), lI<i<n 1<j<n 
forman una base del espacio L(V, V, F). En particular, la dimensión de 
L(V, V, F) es n?. 


Demostración. La base dual (£L,, ..., L,| está esencialmente definida 
por el hecho de que L;(x) es la ¿¡-ésima coordenada de x en la base ordenada (3 
(para todo a de V). Ahora bien, las funciones f;, definidas por 

fila, B) = La)L,(8) 


son formas bilineales del tipo considerado en el Ejemplo 1. Si 


Aa = 1101 + ::- + InQn y PB = Ya + :-- + Y, 
entonces 


F¡¡(a, B) = LY )> 


Sea f cualquier forma bilineal sobre V y sea A la matriz de f en la base or- 
denada GB. Entonces 


Fa, 6) =- 2 ANY 
4) 


que simplemente dice que 


f = 2 As ij. 
1,3 
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Está ahora claro que las n? formas f;, constituyen una base de L(V, V, F). | 


La demostración anterior se puede expresar de otra manera como sigue. 
La forma bilineal f;, tiene por matriz en la base ordenada (3 la matriz «uni- 
taria» E"*, cuyo único elemento no nulo es un 1 en la fila ¿ y la columna j. Como 
estas matrices unitarias constituyen una base del espacio de las matrices n x hn, 
las formas f¡; constituyen una base del espacio de las formas bilineales. 

El concepto de matriz de una forma bilineal en una base ordenada es análo- 
go al de matriz de un operador lineal en una base ordenada. Al igual que para 
los operadores lineales, estamos interesados en qué le sucede a la matriz re- 
presentante de una forma bilineal cuando se pasa de una base ordenada a otra. 
Para ello. supóngase que (G = [%,,...,%,. y G3' = fx,,..., a,) sean dos bases 
ordenadas para V y que f sea una forma bilineal en V. ¿Cómo están relacio- 
nadas las matrices [£]g y L[/lg:? Sea P la matriz n x n (inversible) tal que 


[ala = Plale: 
para todo x en V. En otras palabras, se define P por 


Para vectores x, ff cualesquiera en V 


Sa, B) = [aja [AulBle 

(Plaloe) LA? T8le 

[ale (71161 [8lu. 

Por la definición y unicidad de la matriz representante de f en la base orde- 
nada (GH', debemos tener que 


(10-4) [Hs = PLA. 


Ejemplo 4. Sea V el espacio vectorial R*. Sea f la forma bilineal definida 
por 2 = (x,. 2) y Pf = (v,. y) por 


Ahora fla, B) = iy + UY2 $ Lap + Colo. 


l 1d 
fa, (3) => Lex, X») B | M 


y así la matriz de f en la base ordenada canónica (6 = (€,, €,;, €s 


[fe = | ¡| 


Sea B' = le, €,! la base ordenada definida por e; = (1. —1), €, = (1, 1). 
En este caso, la matriz P que cambia las coordenadas de B' a GB es 


1 1] 
)= . 
/ [-; 1] 
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Así 


[fa = P'[fla? 


AAAIENA 
Lp 
29 


Esto quiere decir que si se expresan los vectores a y f por medio de sus coorde- 
nadas en la base KB”, por ejemplo, 


1 


a = xe + 23€, B = yie + ye 
entonces 
fla, B) = 4Ax2y2. 


Una consecuencia de la fórmula (10-4) para el cambio de base es la siguien- 
te: si A y B son matrices n x n que representan la misma forma bilineal sobre 
V en bases ordenadas (posiblemente) diferentes, entonces A y B tienen el mismo 
rango. En efecto, si P es una matriz n x n inversible y B = P'AP, es evidente 
que A y B tienen el mismo rango. Esto hace posible definir el rango de una forma 
bilineal-en Y como el rango de cualquier matriz que represente la forma en una 
base ordenada para Y. 

Es deseable dar una defintción más intrínseca del rango de una forma bi- 
lineal. Esto se. puede hacer del siguiente modo. Supóngase que f es una forma 
bilineal sobre el espacio vectorial V. Si se fija un vector a de Y, entonces f(a, B) 
es lineal como función de f. De este modo cada «a fijo determina un funcional 
lineal en V,; se representa esta función lineal por £;(x). Repitiendo, si x es un 
vector en Y, entonces £L,(a) es el funcional lineal en Y cuyo valor para cualquier 
vector f es fa, fP). Esto da una transformación a — £L;(a) de V en el espacio 
dual Y*. Como 


ficos + 02, 6) = cf(as, B) + faz, f) 
vemos que 
Ly(coy + a2) = cLy(01) + Ly(02) 


esto es, L, es una transformación lineal de V en V*. 

De modo semejante, f determina una transformación lineal R, de V en V*. 
Para cada f fijo en V, f(a, fP) es lineal como función de a. Se define R,(f) como 
el funcional lineal sobre Y cuyo valor para el vector a es f(a, f). 


Teorema 2. Sea f una forma bilineal sobre el espacio vectorial de dimensión 
finita V. Sean L, y Ry las transformaciones lineales de Y en V* definidas por 
(LjoMB> = fla, P) = (RyPMa). Entonces, rango (Ly) = rango (Ry). 


Demostración. Se puede dar una demostración de este teorema que no 
dependa de las coordenadas. Tal demostración es parecida a la demostración 


Formas hilimesades 159 


de que el rango de fila de una matriz es igual al rango de columna (Sección 3.7). 
Así que se dará aquí una demostración que consiste en elegir un sistema de 
coordenadas (base) y entonces usar el teorema de «rango de fila igual a rango 
de columna». 

Para demostrar que rango (L,) = rango (R;) es suficiente demostrar que 
Ly y Ry tienen la misma nulidad. Sea (3 una base ordenada para V y sea A = [f]g. 
Si a y f son vectores en V, con matrices de coordenadas X e Y en la base orde- 
nada 63, entonces fla, $) = X'AY. Ahora, Ry(8) = O quiere decir que f(a, B)=0 
para todo a en V, es decir, que X"4Y = O para toda matriz n x 1, X. Esta úl- 
tima condición dice que 4Y = O, La nulidad de R;, es, por tanto, igual a la 
dimensión del espacio solución de AY = 0. 

Similarmente, L,(a) = Ó st, y solo si, AY = 0 para toda matriz n x 1, Y. 
Así a está en el espacio nulo de L£, si, y solo si, MA = 0 es decir, AX = 0. La 
nulidad de L£, es, por tanto, igual a la dimensión del espacio solución de A'*X =0. 
Como las matrices A y A' tienen el mismo rango columna, vemos que 


nulidad (L,) = nulidad (Ry). NM 


Definición. Si f es una forma bilineal sobre un espacio de dimensión finita 
V, el rango de f es el entero r = rango (L,) = rango (R,). 


Corolario 1. El rango de una forma bilineal es igual ul rango de la matriz 
de la forma en cualquier base ordenada. 


Corolario 2. Si f es una forma bilineal sobre el espacio vectorial de di- 
mensión n, lo siguiente es equivalente: 


(a) Rango (f) = n. 
(b) Para todo a no nulo de V, existe un ff en V tal que fla, PP) + 0. 
(c) Para todo fB no nulo de V, existe un a en V tal que fla, P) + 0. 


Demostración. La afirmación (b) no dice más que el espacio nulo de L£, es 
el subespacio cero. La afirmación (c) dice que el espacio nulo de R, es el sub- 
espacio cero. Las transformaciones lineales L, y Ry tienen nulidad 0 si, y solo si, 
tienen rango n, €es decir, si, y solo si, rango (f) = n. ] 


Definición. Una forma bilineal f sobre un espacio vectorial V se llama no 
degenerada (o no singular) si satisface las condiciones (b) y (c) del Corolario 2. 


Si V es de dimensión finita, entonces f es no degenerada siempre que f cumpla 
una cualquiera de las tres condiciones del Corolario 2. En particular, f es no 
degenerada (no singular) si, y solo si, su matriz en alguna (toda) base ordenada 
para V es una matriz no singular. 


Ejemplo 5. Sea Y = R” y sea f la forma bilineal definida para a = (x,,..., 
Xn) y B => (Y1> .. .> Y.) por 


Fla, B) = UiY1 + +-* + ZnYn. 
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ntonces / es una forma bilincal no degencerada en KR". La matriz de f en la 
tvise ordenada canónica es la matriz unidad n x n 


fX, Y) = X“Y. 


ste / generalmente se llama producto escalar. El lector estará probaulemente 
tamúiliarizado con esta forma bilineal. al menos para el caso n = 3. Geomc- 
tricamente el número f(a, ff) es el producto de la longitud de x, la longitud de 
f3 y el coseno del ángulo entre x y ff. En particular f(a, $) = O sí. y solo si, los 
vectores a y fí son ortogonales (perpendiculares). 


Ejercicios 
Í. ¿Cuáles de las siguientes funciones / definidas para vectores x = (xy. x,) y fí = ([1,. 1,) 


de R?* son formas bilineales? 


(a) fía, 6) = 1. 

(db) fa, P. = (11 — Y1)* + I2Y2. 

(o fía, B) = (uu + y)? — (11 — y)? 
(d) fa, P) = tiya — Top. 


2. Sca f la forma bilincal sobre R* definida por 
FCer, Y), (La, Y2)) = £uUn + La. 
Hallar la matriz de f en cada una de las siguientes bases 
((1, 0), (0, 1), 1,—D,(1,D), (0,2), (3,95. 


3. Sca V el espacio de todas las matrices 2 x 3 sobre R y sea f la forma bilincal sobre 
J" definida por f(X, Y) = traza (A"4Y). donde 


l 2 
Á = . 
3 4 
Mallar la matriz de f en la base ordenada 
(EN, E*?, ES, En, E?, ES; 
donde E" es la matriz cuyo único elemento no nulo es un | en la fila ¿ y columna ¿. 


4. Describir explícitamente todas las formas bilineales f sobre R* con la propiedad de 
que fía, P) = ff. 2) para todo x, fi. 


5. Describir la forma bilineal sobre R? que satisface fla. 8) = —J(8B. 2) para todo x. f. 


6. Sea n un entero positivo y sea V el espacio de todas las matrices 4 x n sobre el cuerpo 
de los números complejos. Demostrar que 


FA, B) = ntr(AB) — tr (A) tr (B) 
define una forma bilineal f sobre V. ¿Es verdad que f(4, B) = f(B. A) para toda A. B” 


7. Sea f la forma bilineal definida en el Ejercicio 6. Demostrar que f es degenerada (que 
no es no degenerada). Sea V, el subespacio de Y que consiste en las matrices de traza O. y 
sea f, la restricción de f a V,. Mostrar que f, es no degencrada. 


8. Sea f la forma bilincal definida en el Ejercicio 6 y sea V, el subespacio de Y que consis- 
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te en todas las matrices A tal que traza (4) = 0 y 4* = —A (A* es la transpuesta conju- 
gada de 4). Designese por f, la restricción de f a V,. Mostrar que f, es negativamente de- 
linida; es decir, que f,(4. 4) < 0 para cada A no nulo en V,. 


9. Sea f la forma bilineal definida en el Ejercicio 6. Sea W el conjunto de todas las matri- 
ces A en Y tales que f(4. B) = O para todo B. Demostrar que W es un subespacio de Y. 
Describir W explicitamente y hallar su dimensión. 


10. Sca f cualquier forma bilincal sobre un espacio vectorial de dimensión finita 1”. Sea 
M4 el subespacio de todos los fi tales que fla, f$) = O para todo a. Mostrar que 


rango f = dim Y — dim W. 


Usar este resultado y el del Ejercicio 9 para calcular el rango de la forma bilineal defini- 
da en el Ejercicio €. 


MM. Sea f una forma bilineal sobre un espacio vectorial de dimensión finita V. Supón- 
gase que V, es un subespacio de Y con la propiedad de que la restriccióon.de f a Y, es no 
degenerada. Demostrar que rango f > dim V,. 
12. Scan f, g formas bilineales sobre un espacio vectorial de dimensión finita V. Supón- 
gase que g es no singular. Demostrar que existen operadores lineales únicos T,, 7, sobre 
V tales que 

fla, B) = (Tia, B) = gla, T25) 


para todo x, f. 


13. Demostrar que el resultado dado en el Ejercicio 12 no necesita ser cierto si g es 
singular. 
14. Sea f una forma bilineal sobre un espacio vectorial de dimensión finita V. Demos- 


trar que f puede expresarse como producto de dos funcionales lineales (es decir, f(a, f3) = 
L,(a)L,(f$) para L,, L, en V*) sí, y solo si, f tiene rango l. 


10.2. Formas bilineales simétricas 


El propósito principal de esta sección es responder a la siguiente pregunta: 
si f/ es una forma bilineal sobre el espacio vectorial de dimensión finita V, ¿cuán- 
do existe una base ordenada KB de V en la que f esté representada por una matriz 
diagonal? Se demostrará que esto es posible si, y solo si, f es una forma bilineal 
simétrica, es decir, fía. P) = f(f, ax). El teorema se demostrará solo cuando 
el cuerpo de los escalares tiene característica cero, esto es, que si n es un entero 
positivo la suma 1 + 1 + -*:* +1 (n sumandos) en F no es 0, 


Definición. Sea f una forma bilineal sobre el espacio vectorial V. Se dice 
que f es simétrica si fla, P) = F(f, a) para todos los vectores a, B de V. 


Si V es de dimensión finita, la forma bilineal f es simétrica si, y solo si, su 
matriz A en cierta (o en toda) base ordenada es simétrica, 4' = A. Para ver 
esto se requiere saber cuándo la forma bilineal 


FX, Y) = X'AY 
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es simétrica. Esto sucede si, y solo si, XA" AY = Y'AX para todas las matrices 
columnas X e Y. Como X"4Y es una matriz 1 x l, se tiene que AY = F'A'Y, 
Así, pues, f es simétrica si, y solo si, Y'A'Y = Y"AX para todo X, Y. Evidente- 
mente esto quiere decir que A = 4. En particular, debe observarse que si existe 
una base ordenada para Y en la que f está representada por una matriz diago- 
nal, entonces f es simétrica, ya que cualquier matriz diagonal es una matriz 
simétrica. 

Si f es una forma bilineal simétrica, la forma cuadrática asociada con f es 
la función q de V en F definida por 


g(a) = Ha, a). 


Si F es un subconjunto de los números complejos, la forma bilineal simétrica 
está completamente determinada por su forma cuadrática asociada, de acuer- 
do con la identidad de polarización 


(10-5) fla, PB) = aqla + B) — ¿qlo — 6). 


El establecer (10-5) no es más que una rutina de cálculo que se omite. Si f es la 
forma bilineal del Ejemplo 5. el producto escalar, la forma cuadrática aso- 
ciada es 

A E E 


En otras palabras, q(a) es el cuadrado de la longitud de a. Para la forma bilineal 
f AX, Y) = X'AY, la forma cuadrática asociada es 


qa(X) = X'AX = Z Ae xj. 
vt) 


Una clase importante de formas bilineales simétricas son los productos 
internos en los espacios vectoriales reales, estudiados en el Capitulo 8. Si V es 
un espacio vectorial real, un producto interno sobre V es una forma bilineal 
simétrica f sobre V tal que 


(10-6) fla,0a)>0 si: a70. 


Una forma bilineal que cumple (10-6) se llama positivamente definida. Así, un 
producto interno sobre un espacio vectorial real es una forma bilineal simétrica 
y positivamente definida sobre ese espacto. Obsérvese que un producto interno 
es no degenerado. Dos vectores a, f| se llaman ortogonales respecto al pro- 
ducto interno f si f(a, $) = O. La forma cuadrática q(a) = fía, x) toma solo 
valores no negativos y qlo) se considera corrientemente como el cuadrado de 
la longitud de a. Desde luego, estos conceptos de longitud y ortogonalidad 
tienen su origen en el más importante ejemplo de un producto interno —el 
producto escalar del Ejemplo $. 

Si f es cualquier forma bilineal simétrica sobre un espacio vectorial V, es 
conveniente aplicar en parte la terminología a los productos internos a f. Es 
especialmente conveniente decir que a y ff son ortogonales con respecto a f, si 
fía, PB) = O. No es aconsejable pensar en f(a, a) como el cuadrado de la longi- 
tud de a; por ejemplo, si Y es un espacio vectorial complejo, se puede tener 


fla, a) =./—1, o en un espacio vectorial real, f(a, 4) = —2. 
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Se vuelve abora al icorema básico de esta sección. Al leer la demostración, 
le será de provecho al lector pensar en el caso especial en que Y es un espacio 
vectorial real y f un producto interno sobre Y. 


Teorema 3, Sea V un espacio vectorial de dimensión finita sobre un cuerpo 
de característica cero, y sea f una forma bilineal simétrica sobre V. Entonces 
existe una base de V en la que f está representada por una matriz diagonal. 


Demostración. Lo que se debe hallar es una base ordenada 


GB = (01, - - -, Un) 


tal que f(a,. 2,) = 0 para ¿4 Si f =00nm = 1, el teorema es evidentemente 
cierto. Por tanto, se puede suponer que f 40 y n> 1. 5S1 f(z. a) = O para 
todo a.en Y, la forma cuadrática asociada q es idénticamente O y la identidad 
de polarización (10-5) muestra que f = 0. Entonces existe un vector a en Y tal 
que (a, 1) = q(a) + 0. Sea W el subespacio unidimensional de V que es gene- 
rado por a y sea W? el conjunto de todos los vectores $ en V tales que f(a, $) = 0. 
Afirmamos que V= W GQ W!?. Ciertamente, los subespacios W y W* son 
independientes. Un vector típico de W es ca, donde c es un escalar. Si también 
ca está en W?, entonces fíca, ca) = cAfla, a) = 0. Pero fía, a) + 0, luego 

= (). Así que cada vector de V es suma de un vector de W y de un vector de W?. 
En efecto, sea y cualquier vector en V, y se hace 


_ Hr, a a) 
[== Maa 
Entonces 


— Hr, a 
fla, B) = fía, y) — fla, la, ay e J a) 


y como f es simétrica, f(a, fB) = O. Así f está en el subespacio W?. La expresión 


fir, a) 
faja) o Fe 
muestra que Y = W + W?. 

La restricción de f a W* es una forma bilineal simétrica. Como W? tiene 
dimensión (1 — 1), suponer por inducción que W* tiene una base [a,, ..., %,) 
tal que 

fas, aj) = 0, 1X3](1>2,32 2). 


Haciendo a, = a, se obtiene una base (%,, ..., aj de Y tal que fla,. a) = 0 
para ¿¡+4j. 


Corolario. Sea F un subcuerpo de los números complejos, y sea A una ma- 
triz simétrica n x n sobre F. Entonces existe una matriz n x n inversible P sobre 
F tal que P'AP es diagonal. 


En caso de que F sea el cuerpo de los números reales, la matriz inwersible 
P de este corolario puede elegirse de modo que sea una matriz ortogonal, es 
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decir, P' = P7*, En otras palabras, si 4 es una matriz simétrica real 1 x A, 
existe una matriz ortogonal real P tal que P'AP cs diagonal; sin. embargo, esto 
no es del todo evidente en lo que se hizo anteriormente (véase Capitulo 8). 


Teorema 4. Sea V un espacio vectorial de dimensión finita sobre el cuerpo 
de los números complejos. Sea f una forma bilineal simétrica sobre V que tiene 
rango r. Entonces existe una base ordenada B = [f,, ..., fB,j de V tal que 


(i) la matriz de f en la base ordenada GB es diagonal; 


(id AB, By) = lo pan 


j>r. 
Demostración. Por el Teorema 3, existe una base ordenada (a,, ...., 4) 
de Y tal que 


fa, a) =0 para ¿4j 


Como f tiene rango r. también lo tendrá su matriz en la base ordenada [xa,,....a,). 
Entonces debemos tener que f(x;, a;) + O para r valores de j precisamente. Reor- 
denando los vectores «a,, se puede suponer que 


Fla; aj) 0, j=1,...,7. 


Se usa ahora el hecho de que el cuerpo de los escalares es el cuerpo de los nú- 
meros complejos. Si ./f(a;, a) representa cualquier raíz cuadrada compleja 
de fla; a) y si se hace 


1 


To Aj) j= L...,7 
Bj = vVi(a;, aj) Í 
Aj, 3 > T 
la base [B,, ..., fB,) satisface las condiciones (i) y (ii). | 


Naturalmente, el Teorema 4 es válido si el cuerpo de los escalares es cual- 
quier subcuerpo de los números complejos en el que cada elemento tiene una 
raiz cuadrada. No es válido, cuando el cuerpo escalar es el cuerpo de los nú- 
meros reales. Sobre el cuerpo de los números reales tenemos el siguiente susti- 
tuto para el Teorema 4. 


Teorema 5. Sea V un espacio de dimensión n sobre el cuerpo de los núme- 
ros reales y sea f una forma bilineal simétrica sobre V que tiene rango r. Entonces 
existe una base ordenada [f,, Bz, ..- , Bny de V en la que la matriz de f es dia- 
gonal y tal que 


FB) P)=+l  j=L... +57 


Además, el número de vectores de base PB; para los que f(B;, P',) = 1 es indepen- 
diente de la elección de base. 
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Demostración. Existe una base fa,. .... 0, de V tal que 


fa; a) = 0, 2 Jj] 
fla; aj) 40, 1<73<r 
Fa, a,) = O, Y) > Tr 


Sea 


B; - [fas, a) las, 1 < J < r 
Bj, = a), J>T. 


Entonces (B,, ..., f,j es una base con las propiedades establecidas. 

Sea p el número de vectores de base fi, para los que f(B;, P;) = 1; se debe 
demostrar que el número p es independiente de la base particular que tenemos, 
que satisface las condiciones establecidas. Sea V* el subespacio de V generado 
por los vectores de base ff, para los que f(f;,, fP;) = 1 y sea V” el subespacio 
generado por los vectores de base f; para los que f(f;, fP;) = —1. Ahora 
p = dim V*, de modo que es la unicidad de la dimensión de V* la que se debe 
demostrar. Es fácil ver que si a es un vector no nulo de V*, entonces f(a, x) > 0; 
en otras palabras, f es positivamente definida sobre el espacio V*. En forma 
análoga, si x es un vector no nulo de V”, entonces f(x, a) < 0; es decir, f es 
negativamente definida en el subespacio V”. Sea ahora V* el subespacio genera- 
do por los vectores de base fí; para los que f(f;, f¡) = O. Si a está en V*, enton- 
ces fía, f$) = O para todo ff en V. 

Como [f,,...., f, | es una base de V, se tiene que 


Y =V+*B6V yv. 
Además, se afirma que sí W es cualquier subespacio de V en el que f es posi- 
tivamente definida, entonces los subespacios W, V” y V* son independientes. 


En efecto, supóngase que x está en W, Ben V , yen V y quea + fB+y=0. 
Entonces 


0 = fla, a + B + y) = flasa) + f(a, B) + Ja, y) 
0=fB,a + B+ 7) =$(B, 0) + £(B, B) + $(B, y). 


Como y está en V?, fla, y) = f(B, y) = 0; y como f es simétrica, se obtiene 


0 =f(a, a) + fla, 6) 
0 = f(B, PB) + fa, 6) 

Luego fla, a) = f(f, fP). Como fla, a) > 0 y f(f, PB) < O, se sigue que 
Fa, a) = $(8, B) = 0. 


Pero f es positivamente definida sobre W y negativamente definida sobre Y” 
Se concluye que a = f = 0 y luego también que y = 0. Como 


V=V+0DV-Qv! 


y W, V7, V* son independientes, vemos que dim W < dim V*. Esto es, si 
W es cualquier subespacio de V en el que f es positivamente definida, la di- 
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mensión de W no puede exceder la dimensión de J*. Si 63, es otra base orde- 
nada de V que satisface las condiciones del teorema, se tendrán los correspon- 
dientes subespacios V?, Vi y V¡; y el razonamiento anterior muestra que 
dim Vi? < dim V*. Invirtiéndolo, se obtiene que dim V* < dim V; y, por 
tanto, 


dim V+ = dimV?. ] 


Varios comentarios habría que hacer respecto a la base (6B,, ..., f,j del Teo- 
rema 5 y de los subespacios asociados V*, V” y V?. Primero obsérvese que 
V1 es exactamente el subespacio de los vectores que son «ortogonales» a todos 
los de Y. Se observó anteriormente que M+* está contenido en este subespacio; pero 


dim V* = dim V — (dim V* + dim V7) = dim V — rango f 


de modo que todo vector a tal que fla, $) = O para todo f debe estar en V?. 
Así que el subespacio Y* es único. Los subespacios W* y V” no son únicos; 
sin embargo, sus dimensiones son únicas. La demostración del Teorema 5 mues- 
tra que Y* es la mayor dimensión posible de cualquier subespacio en el que f 
es positivamente definida. En forma análoga, dim V” es la mayor dimensión 
de cualquier subespacio en el que f es negativamente definida. Por cierto 


dim V* + dim V” = rango f. 


El número 
dim V* — dim V7 


es a menudo llamado signatura de f. Se le introduce porque las dimensiones 
de V* y V” están determinadas fácilmente por el rango de f y la signatura de f. 

Debería hacerse tal vez un comentario sobre la relación de las formas bili- 
neales simétricas sobre espacios vectoriales reales con los productos internos. 
Supóngase que V es un espacio vectorial real de dimensión finita y que Y,, V,, 
V, sean subespacios de V tales que 


V = V,O V.0 V.. 


Supóngase que f, es un producto interno sobre Y, y f, es un producto interno 
sobre V,. Se puede entonces definir una forma bilineal simétrica f sobre V del 
siguiente modo: si a, f$f son vectores de V, entonces se puede escribir 


A = Ay + 02 + Az y P = PB, + Ba + Pa 
con a, y fP, en V;. Sea 
fa, b) - f(a,, B,) — f (a, B3). 


El subespacio V* para f será V,; V, es un adecuado V* para f, y V, es un ade- 
cuado V”. Una parte de la afirmación del Teorema $ es que toda forma bilineal 
simétrica sobre Y surge de este modo. El resto del contenido del teorema es 
que un producto interno está representado en alguna base ordenada por la 
matriz unidad. 
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Ejercicios 


l. Las siguientes expresiones definen formas cuadráticas q sobre R?. Hallar la forma 
bilineal simétrica f correspondiente a cada q. 


(a) ax?.: (e) 1? + 923. 
(b) bxr,22. (1) 3x1t2 — 23. 
(c) cz2. (a) 417 + 6zxize — 322. 


(d) 23 — 42122. 


2. Hallar la matriz, en la base ordenada canónica, y el rango de cada una de las formas 
bilineales determinadas en el Ejercicio 1. Indicar cuáles formas son no degeneradas. 


3. Sea q(x,, x,) = axi + bx,x, + cx3 la forma cuadrática asociada con una forma bi- 
lineal simétrica f sobre R?. Demostrar que f es no degenerada si, y solo si, b? — 4ac 4 0. 


4. Sea V un espacio vectorial de dimensión finita sobre un subcuerpo FF de los números 
complejos y sea S el conjunto de todas las formas bilineales simétricas sobre Y. 

(a) Demostrar que S es un subespacio de L(V, Y, F). 

(b) Hallar dim $. 


Sea Q el conjunto de todas las formas cuadráticas sobre Y. 


(c) Demostrar que OQ es un subespacio del espacio de todas las funciones de V en F. 

(d) Describir explícitamente un isomorfismo 7 de O sobre $, sin referencia a una base. 

(e) Sea U un operador lineal sobre V y q un elemento de O. Mostrar que la iguakdad 
(UtqNa) = q(Ua) define una forma cuadrática U*tg sobre V. 

(f) Si U es un operador lineal sobre V, demostrar que la función U Y definida en la 
parte (e) es un operador lineal sobre O. Demostrar que Ut es inversible si, y solo si. U es 
inversible. 


5. Sea q la forma cuadrática sobre R? dada por 
q(x1, 22) = azi + 2bx,22 + czz, a 40. 


Hallar un operador lineal inversible U sobre R? tal que 
p2 
Utd, 2) = 0 + (0) 


(Sugerencia: Para hallar U7* (y luego U) completar el cuadrado. Para la definición de U* 
véase parte (e) del Ejercicio 4.) 
6. Sea q la forma cuadrática sobre R? dada por 
q(x1, 22) = 2b71%2. 
Hallar un operador lineal inversible U sobre R? tal que 
(Ut (z,, 12) = 2bx3% — 2bx%. 
7. Sea q la forma cuadrática sobre R? dada por 
Q(T1, La, 23) = 1122 + 21,23 + 23. 


Hallar un operador lineal inversible U sobre R?* tal que 


(Ut (x,, 22, 23) = 9d — 24 23. 
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(Sugerencia: Expresar U como producto de operadores análogos a los usados en el Ejer- 
cicio 5 y 6.) 


8. Sea A una matriz simétrica n x n sobre R, y sea q la forma cuadrática sobre R” dada 
por 


Q(Z1, +, Tn) = 2 Ai¡tiZ. 
1) 


Generalizar el método usado en el Ejerticio 7 para demostrar que existe un operador lineal 
inversible U sobre R” tal que 


(Ufg)MZ1, - - -, Tn) = 2 Citi 


donde c, es 1, —1,00,i¡=1,...,n. 


9. Sea f una forma bilineal simétrica sobre R”. Usando el resnltado del Ejercicio 8, de- 
mostrar que existe una base ordenada (3 tal que [f lg es diagonal. 


10. Sea V el espacio vectorial real de todas las matrices (complejas) hermíticas 2 x 2, 
esto es, matrices complejas 2 x 2, A, que cumplen 4;;= Aj; 
(a) Demostrar que la igualdad q(4) = det A definc una forma cuadrática q sobre Y. 
(b) Sea W el subespacio de V de las matrices de traza 0. Demostrar que la forma bili- 
neal f determinada por q es negativamente definida en el espacio W 


11. Sean V un espacio vectorial de dimensión finita y f una forma bilineal simétrica no 
degenerada sobre Y. Demostrar que, para todo operador lineal 7 sobre V, existe un único 
operador 7” sobre V tal que f(Ta, $) = fla, T'B) para todo a, f| de V. Demostrar tam- 
bién que 

(TT)! = T2T; 


(aT, + CT 9)' cT; + caT» 
(7y = T. 


l 


¿Cuánto de lo anterior sigue siendo válido sin la suposición de que T es no degenerada? 


12. Sean F un cuerpo y V el espacio de las matrices n x 1 sobre F. Supóngase que A es 
una matriz n x n dada sobre F y que f es la forma bilineal sobre V definida por /(X, Y) = 
X"AY. Supóngase que f es simétrica y no degenerada. Sea B una matriz n x n sobre F y 
T el operador lineal sobre V que aplica X en BX. Hallar el operador 7” del Ejercicio 11. 


13. Sean V un espacio vectorial de dimensión finita y f una forma bilineal simétrica no 
degenerada sobre V. Asociado a f hay un isomorfismo «natural» de Y sobre el espacio 
dual V*; este isomorfismo es la transformación Ly de la Sección 10.1. Usando Ly, demos- 
trar que para cada base (B = (a,,..., qa,) de V existe una única base (3 = (a;,..., 0,) 
de V tal que f(o;, a;) = 9,;, Mostrar entonces que para todo vector a de V se tiene que 


a = Ef(a, ajja = Ela; aja. 


14. Sean V, f, G y (GH3' como en el Ejercicio 13. Supóngase que T es un operador lineal 
sobre V y que T” es el operador que f' asocia a T como en el Ejercicio 11. Demostrar que 


(a) [T'la = [T16. 
(b) tr (T) = tr (T*) = 3 f(Ta,, a;). 
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IS. Scan Y, f, G y 03 como en cl Ejercicio 13. Supóngase que [/]g = A. Demostrar que 
o, = (A Dia, = (AD 50, 
j j 


l6. Sean F un cuerpo y Y el espacio de las matrices n x 1 sobre F. Supóngase que A es 
una matriz n x n inversible y simétrica sobre F y que f es la forma bilineal sobre Y detini- 
da por f(X, Y) = X"AY. Sean P una matriz inversible n x n sobre F y GB la base de Y que 
consiste en las columnas de P. Hacer ver que la base G3' del Ejercicio 13 consta de las co- 
lumnas de la matriz A7*(P'y"?. 


17. Sean V un espacio vectorial de dimensión finita sobre un cuerpo F y f la forma bili- 
neal simétrica sobre V. Para cada subespacio W de V, sea W* el conjunto de todos los ver- 
tores a. de Y de modo que f(a, $) = O para todo f de W. Demostrar que 

(a) W* es un subespacio. 

(b) Y = £03”. 

(c) V* = [01 si, y solo si, f es no degenerada. 

(d) rango f = dim V — dim V? 

(e) Si dim Y = n y dim W = m, entonces dim W* > n — m. (Sugerencia: Sea Br... 
fP,! una base de W y considérese la aplicación 


a — fa, By), e... , Fa, Bm)) 


de Y en F”). 
(£) La restricción de f a W es no degenerada si, y solo si, 


Wnw = (0). 
(g) V= WOW” si, y solo si, la restriccion de f a W es no degenerada. 


18. Sean V un espacio vectorial de dimensión finita sobre C y f una forma bilineal sime- 
trica no degenerada sobre V. Demostrar que existe una base (GB de Y tal que G' = GB. (Véase 
Ejercicio 13 para la definición de 3”) 


10.3. Formas bilineales antisimétricas 


En toda esta sección, Y será un espacio vectorial sobre un subcuerpo F del 
cuerpo de los números complejos. Una forma bilineal f en V se llama antisi- 
métrica si f(a, PB) = —/(f, a) para todos los vectores a, f de V. Se demostrará 
un teorema que se refiere a la simplificación de la matriz de una fomma bilineal 
antisimétrica sobre un espacio de dimensión finita V. Primero, se harán algunas 
observaciones generales. 

Supóngase que f es cualquier forma sobre V. Si se hace 


g(a, B) = ¿[fa B) + F(B, a)] 
ha, PB) = zLfla, PB) — S(B, a)] 


entonces es fácil verificar que g es una forma bilineal simétrica sobre Y y que 
h es una forma bilineal antisimétrica sobre V. También que f = g + h. Además. 
esta expresión de V, como suma de una forma simétrica y una antisimétrica. 
es única. Así el espacio L(V, V, F) es suma directa del subespacio de las formas 
simétricas y del subespacio de las formas antisimétricas. 
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S1 Y es de dimensión finita, la forma bilineal f es antisimétrica si, y solo si, 
su matriz A en alguna (o en toda) base ordenada es antisimétrica, 4' = —A. 
Esto se demuestra del mismo modo que se demostró el correspondiente hecho 
respecto a las formas bilineales simétricas. Cuando f es antisimétrica, la matriz 
de f en cualquier base ordenada tendrá todos sus elementos en la diagonal 
iguales a 0. Esto corresponde a la observación de que fía, a) = O para todo a 
de Y, ya que fla, a) = — fla, a). 

Supóngase que f es una forma bilineal antisimétrica no nula sobre Y. Como 
fF F 0, existen vectores a, ff de V tales que f(a, B) + O. Multiplicando a por un 
escalar apropiado, se puede suponer que f(a, $) = 1. Sea y cualquier vector 
del subespacio generado por a y f, por ejemplo, y = ca + df. Entonces 


f(, a) = fica + dB, a) = df(B, a) = —d 
Fr, PB) = fica + dB, B) = cfla, PB) =c 


y así 
(10-7) y = fy, Bja — fr, aJB. 


En particular, obsérvese que a y f son necesariamente independientes; en efecto, 
si y = 0, entonces f(y, a) = fíy, PB) = 0. 

Sea W el espacio bidimensional generado por a y f. Sea W* el conjunto 
de todos los vectores ó de Y tales que /(9, a) = f(Ó. fB) = 0; esto es, el conjunto 
de todos los ó tales que /(9, y) = O para todo y en el subespacio W. Se afirma 
que V = W GQ W?. En efecto, sea e cualquier vector de Y y 


Y Fe, B)Ja — Fe, a)B 


0d =e— yv. 


Entonces y está en W, y d está en W?*, para 


Ko, a) = fe — fc, Bja + Sc, 0dB, a) 

= f(e, a) + flo, JfIB, a) 

= () 
y en forma análoga, f(6, f) = O. Asi, pues, todo e de V es de la forma € = y + 0 
con y en W y en W?. De (9-7) es claro que W y W* = (0), y asi V = WQ W?. 

Ahora la restricción de f a W* es una forma bilineal antisimétrica sobre W?. 

Esta restricción puede ser la forma cero. Si no es éste el caso, existen vectores 
x" y f" en W! tales que f(a”, B') = |. Si W* es el subespacio bidimensional 
venerado por a' y ff”, entonces se tendrá que 


V = WOWoGWvo 


donde W, es el conjunto de todos los vectores 4 de W” tales que fla”, 0) = 
A(B", 6) = 0. Si la restricción de f a W, no es la forma cero, se pueden elegir 
vectores a”, $” en W, tales que fla”, PB”) = 1, y se sigue asi. 

En el caso de dimensión finita, se obtiene inmediatamente una sucesión 
finita de parejas de vectores 


(as, Bu), (as, Ba), .. .7 (az, Br) 
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con las siguientes propiedades: 


(a) May, Pj)= 1,J=1, ..., K. 
(b) fa,. a,) = HB, b;) = Ho;, B;) =0, 4 J. 


(c) Si W, es el subespacio bidimensional generado por a; y f,, entonces 


V = WO ... O W.¿O Wo 
donde todo vector de W, es «ortogonal» a todos los a, y f;, y la restricción de 
Ja Woes la forma cero. 


Teorema 6. Sea V un espacio vectorial de dimensión n sobre un subcuerpo 
de los números complejos y sea f una forma bilineal antisimétrica sobre V. Enton- 
ces el rango r de f es par, y sir = 2k, existe una base ordenada de V en que la ma- 
triz de f es suma directa de la matriz cero (n — r) x (n — r) y k matrices 2 x 2 


iguales a 
0 | 
-1 50 
Demostración. Sean %,, PB ,, .- ., Ax, P, los vectores que satisfacen las con. 
diciones anteriorés (a), (b) y (c). Sea [y,, ..., y,) cualquier base ordenada del 


subespacio W¿. Entonces 
B = (ar, Br, 0%, Pz, .- - , Uk, Br, Yi) - - - > Ya) 


es una base ordenada de Y. Por (a), (b) y (c) es inmediato que la matriz de f en 
la base ordenada (3 es suma directa de la matriz cero (n — 2k) x (n — 24) y 
k matrices 2 x 2 iguales a 


O 1 
10-8 . 
(10-8) o 
Además, es claro que el rango de esta matriz y, por tanto, el de f es 2k. 


Una consecuencia de lo anterior es que sí f es una forma bilineal antisime 
trica no degenerada sobre V, entonces la dimensión de Y debe ser par Si 


dim V = 2k, existirá una base ordenada [%,, B,, -.., 0%, P,) de V tal que 
0, 1% 
fas, B;) — e ¡= j 


Fla;, aj) = HBi, Bj) = O. 


La matriz f en esta base ordenada es suma directa de k matrices antisimctricas 
2 x 2 como la (10-8). Se obtiene otra forma canónica para la matriz de uni 
forma antisimétrica no degenerada si, en vez de la base ordenada dada anterior- 
mente, se considera la base ordenada 


lar, ..-,%o Br. -, Bij- 


El lector hallará fácil verificar que la matriz de f en la última base ordenada 
tiene la forma bloque 
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que «preservan» f. El conjunto de todas las matrices [7] ¿. donde TF es un ope- 
rador lincal que preserva f, será grupo para la multiplicación matricial. Hay 
otra descripción de este grupo de matrices, y es la siguiente. Sca 4 = Lg 
de modo que si x y f son vectores de Y con las respectivas matrices de coorde 
nadas X e Y respecto de (B, se tendrá que 


fla, B) = X'AY. 


Sea T cualquier operador lineal sobre Y y M = [T]g. Entonces 


f(Ta, T£) = (MX)'A(MY) 
= X'(M'AM)Y. 


Por tanto, T preserva f sí, y solo si, M'AM = A. Entonces, en lenguaje matricial, 
el Teorema 7 dice lo siguiente: si A es una matriz n x hn imversibie, el conjunto 
de todas las matrices n x n, M, tales que M'AM = A es grupo para la multi- 
plicación matricial. Si A = [f]g, entonces M está en este grupo de matrices 
si, y solo si, M = [T]¿g, donde T es un operador lineal que preserva f. 

Antes de ver algunos ejemplos queremos hacer una observación más. Supón- 
gase que f es una forma bilineal simétrica. Un operador lineal 7' preserva f 
si, y sclo si, 7 preserva la forma cuadrática 


qgla) = fla, a) 
asociada a. f. Si T preserva f, ciertamente tenemos que 
q(Ta) = f(Ta, Ta) = fla, a) = gla) 
para todo a de V. Recíiprocamente, como f es simétrica, la identidad de po- 
larización 
fla, BP) = ¿qlo + B) — 1qgla — B) 
muestra que 7 preserva f con tal que g(Ty) = q(y) para todo y de V. (Se está 


suponiendo aquí que el cuerpo escalar es un subcuerpo de los números com- 
plejos.) 


Ejemplo 6. Sea V el espacio R” o C”. Sea f la forma bilineal 
fa, B) = z TY; 
j= 


donde a = (x,,...,Xx,)y fB = (Yi - - - » Jn). El grupo que preserva f es llamado 
grupo ortogonal (real o complejo) n-dimensional. El nombre de «grupe orto- 
gonal» más corrientemente se aplica al grupo asociado de matrices en la base orde- 
nada canónica. Como la matriz de f en la base canónica es /. este grupo consiste 
en las matrices M que cumplen M'M = 1. Una matriz asi se llama matriz ortogonal 
n x n (real o compleja). Los dos grupos ortogonales n x n se designan co- 
rrientemente por O(n, R) y O(n, C). Naturalmente, el grupo ortogonal es tam- 
bién el grupo que preserva la forma cuadrática 


ada, ..., 2) =óA4 + +2 


Formas hilmeatdos 175 


Ejemplo 7. Sca f' la forma bilincal simctrica sobre R”" con forma cua- 
drática 


Pp n 
2 
q(zi, . : . 7) Zn) = 2 tj — > . 
j=1 J=p+1 


Entonces f' es no degenerada y tiene signatura 2p — n. El grupo de matrices que 
preservan una forma de este tipo se llama grupo seudoortogonal. Cuando p=n 
“e tiene el grupo ortogonal O(n, R) como un tipo particular de grupo seudo- 
ortogonal. Para cada uno de los n + 1 valores p = 0, 1, 2, ..., n se obtienen 
formas bilineales f diferentes; sin embargo, para p = k y p = mn — k las formas 
son opuestas una de otra y tienen, pues, el mismo grupo asociado. Asi, cuando 
n es impar, se tienen (n + 1)/2 grupos seudoortogonales de matrices rn x n, 
y cuando n es par tenemos (n + 2)2 de tales grupos. 


Teorema 8. Sea V un espucio vectorial de dimensión n sobre el cuerpo de 
los números complejos y sea f una forma bilimeal simétrica no degenerada sobre 
V. Entonces el grupo que preserta f es isommorfo al grupo ortogonal comple- 
jo O(n, C). 


Demostración. Por supuesto, un isomorfismo entre dos grupos significa 
correspondencia biunivoca entre sus elementos que «preservan» la operación 
de grupo. Sea G el grupo de los operadores lineales sobre Y que preservan la 
forma bilineal f Como f es simétrica y no degenerada, el Teorema 4 dice que 
existe una base ordenada (B de J' en la que f está representada por la matriz 
identidad n x n. Por tanto, un operador lineal 7 preserva f si, y solo si, su matriz 
en la base ordenada (3 es una matriz ortogonal compleja. Luego 


T=> [Tlg 
es un isomorfismo de G sobre O(n, C). 


Teorema 9. Sea V un espacio vectorial de dimensión n sobre el cuerpo de 
los números reales y sea f una forma bilineal simétrica no degenerada sobre V. 
Entonces el grupo que preserva f es isomorfo au un grupo seudoortogonal n x n. 


Demostración. Repetir la demostración del Teorema 8, usando ahora el 
Teorema 5 en vez del 4. | 


Ejemplo 8. Sea f la forma bilineal simétrica sobre R* con la forma cua- 
drática 


q(t,y,2,t) =1?— 1? — y?— 22 


Un operador lineal 7 sobre R* que preserva esta forma bilineal (o cuadrática) 
particular, se llama transformación de Lorentz, y el grupo que preserva f se 
llama grupo de Lorentz. He aquí un método para describir algunas transfor- 
maciones de Lorentz. 

Sea H el espacio vectorial real de las matrices complejas 2 x 2, A, hermíti- 
cas, A = A*. Es de fácil verificación que 
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l+r y>+ | 
Pz, y, 2,1) = o 
aua0o=| 17 + 
define un isomorfismo Y de R* sobre el espacio H. Por este isomorfismo la 
forma cuadrática q se aplica sobre la función determinante, esto es 
iba y+ e] 
= det 


q(a) = det Ha). 


Lo cual sugiere que se pueden estudiar las transformaciones de Lorentz sobre 
R* estudiando los operadores lineales sobre H que preservan determinantes. 
Sea M una matriz compleja 2 x 2, y para una matriz hermítica A, defíinase 


UM(A) = MAM*. 


Ahora bien, MAM* es también hermítica. Partiendo de esto es fácil ver que 
U,, es un operador lineal (real) sobre H. Veamos cuándo es cierto que U,, «pre- 
serva» determinantes; es decir, det U,,(4) = det A para toda 4 de H. Como 
el determinante de AM1* es el complejo conjugado del determinante de M, se 
ve que 


det [U(4)] = [det M1]? det A. 


Así que U,, preserva determinantes precisamente cuando det M tiene valor 
absoluto 1. 


Así que tomando ahora una matriz compleja 2 x 2, M, para la que 
[det M| = 1, entonces U,, es un operador linea sobre H que preserva deter- 
minantes. Se define 


Tm = yIU yo. 


Como 0 es un isomorfismo, 7;, es un operador lineal sobre R*. También, Ty, es 
una transformación de Lorentz; en efecto, 


q(Tya) 


q(bU mba) 

det (P6-1U,¡Pa) 
det (Usa) 

= det (Pa) 

= q(a) 


y de este modo Ty, preserva la forma cuadrática q. Utilizando matrices 2 x 2, M, 
específicas, se puede emplear el método anterior para calcular transformaciones 
de Lorentz especificas. Dos comentarios al respecto, que no son dificiles de 
verificar. 


l 


(1) Si M, y M, son matrices 2 x 2, inversibles con elementos comple- 
jos, entonces U,,, = Uy, si, y solo si, M, es un múltiplo escalar de M,. Ási, 
todo lo de las transformaciones de Lorentz vistas anteriormente se puede obte- 
ner de las matrices unimodulares M, esto es, de matrices M que satisfacen 
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det Af = 1. Si M, y M, son matrices unimodulares tales que M, + M, y 
M, HF —M,, entonces Ty, + Ty, 

(2) No toda transformación de Lorentz se puede obtener por el méto- 
do anterior. 


Ejercicios 
l. Sea M un elemento del grupo ortogonal complejo Otna. C) Mostrar que M". 
M y M* = M' también pertenecen a Ola, C). 


2. Supóngase que M pertenece a O(n, C) y que M' es semejante a M. ¿Pertenece M' tam- 
bien a O(a, C)? 


3. Sea 
Yy= 2 Mits 
k=1 


donde M es un elemento de O(n, C). Demostrar que 


4. Sca M una matriz n x a sobre C” con colummas M,, M,, .... M,. Demostrar que A! 
pertenece a O(n, C) st, y solo si, 


MM = Ó ho 


5. Sca X una matriz n x | sobre C. ¿En qué condiciones O(s, (C) contiene una matriz 
M“ cuya primera columna es X? 


6. Hallar una matriz en O(3, C) cuya primera fila es (21, 2:, 3). 


7. Scan V el espacio de todas las matrices n x | sobre C y £ la forma bilineal sobre Y 
dada por f(X, Y) = A" Y. Sea M perteneciente a O(41, C). ¿Cuál es la matriz de f en la base 
de Y tormada por las columnas M,, M,, ..., M, de M? 


8. Scan X una matriz 1 x | sobre C' tal que AX = 1 e Y; la f-ésima columna de la matriz 
unidad. Demostrar que existe una matriz M cn O(n, C) tal que MX = /,. Si X tiene ele- 
mentos reales, mostrar que hay una M en O(n. C) con la propiedad de que MX = [/,. 


9. Sean V el espacio de todas las matrices n x 1 sobre C, A una matriz n x n sobre € y 
f la forma bilineal sobre Y dada por /(X. Y) = X"4Y. Demostrar que f es invariante por 
O(n. C); es decir, [(MX, MY) = [(X, Y) para todo X, Y de Y y M cn On, C) si, y solo si, 
A conmuta con cada elemento de O(a, C). 


10. Sean S cualquier conjunto de matrices n x n sobre C y S' el conjunto de todas las 
matrices n x n sobre C que conmutan con cada elemento de S. Demostrar que S” es un 
álgcbra sobre C. 


11. Scan F un subcucrpo de C, Y un espacio vectorial de dimensión finita sobre F y f una 
forma bilincal no singular sobre Y. Si T es un operador lineal sobre Y que preserva f. de- 
mostrar que det T = +1. 


12. Sean F un subcucrpo de C, V el espacio de las matrices n x 1 sobre F, A una matriz 
n xn inversible sobre F y / una forma bilineal sobre V dada por f(X, Y) = X"AY. Si M es 
una matriz n x n sobre F, demostrar que M preserva f si, y solo si, A” 'M'4 = M !. 
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13, Sca g£ una forma bilincal no singular sobre un espacto vectorial de dimensión finita 
J. Supóngase que T es un operador lincal inversible sobre Y y que f es. la forma bilincal 
sobre Y dada por /(a. $) = ela, 7/$). Si U es un operador lineal sobre V, hallar condicto- 
nes necesarias y suficientes de U para preservar f. 


14. Sea T un operador lineal sobre C? que preserva la forma cuadrática x? — x3. Demos- 
trar que 

la) det (7) = +1. 

(b) Si M es la matriz de T en la base canónica, entonces M», = +M,¡. Mz, = +M,», 
MM? —_ M?, = 1. 

(c) Si det M = 1, entonces existe un número complejo no nulo c tal que 


eplo_1 
1 c C 

u => 1 1] 
c= c+- 
C Cc 

(d) Si det M = —1, entonces existe un número complejo « tal que 
1 Cc C 
M=3 . 

2 1 l 
—+2v —e-— 

Cc Cc 


15. Sea f la forma bilineal sobre C? definida por 


Í(zs, 12), (Yu, Ya)) = TY2 — TUY1> 


Demostrar que 

(a) Si T es un operador lineal sobre C?, entonces f(Ta, Tf) = (det T)Y/(a, KB) para 
todo x, fí en C?. 

(b) T preserva f sí y solo si, det T = +1. 

(c) ¿Qué dice (b) respecto al grupo de matrices 2 x 2, M, tales que M'AM = A, donde 


O 1 
= ? 
Á 1 ol 
16. Sean un entero positivo n, I la matriz unidad n x n sobre C y J la matriz 2n x 2n 
dada por 
0 
y = 7 o) 
Sea M una matriz 2n x 2n sobre C de la forma 
A B 
MH = Lo p! 


con A. B, C, D matrices n x n sobre C. Hallar condiciones necesarias y suficientes de 4, 
B, C,D para que M'JM = J. 


17. Hallar todas las formas bilineales sobre el espacio de las matrices n x 1 sobre R que 
son invariantes por O(n, R). 


18. Hallar todas las formas bilineales sobre el espacio de las matrices n x |, sobre C que 
son invariantes por O(n, C). 


Apéndice 


Este apéndice se divide lógicamente en dos partes. La primera, que abarca 
las primeras tres secciones, contiene ciertos conceptos fundamentales que apa- 
recen a lo largo del libro (en realidad, a lo largo de la matemática). Es más bien 
una introducción para el libro que un apéndice. La segunda parte es más ge- 
nuinamente un apéndice al texto. 

La Sección 1 contiene un estudio sobre los conjuntos, sus uniones e inter- 
secciones. La Sección 2 analiza el concepto de función y las ideas relacionadas 
de imagen, dominio, función recíproca y restricción de una función a un sub- 
conjunto de su dominio. La Sección 3 trata de las relaciones de equivalencia. 
La materia en estas tres secciones, especialmente la de las Secciones 1 y 2, está 
presentada de modo un tanto conciso. Se trata más bien de un convenio sobre 
terminología que de una exposición detallada. En estricto sentido lógico, este 
material constituye una parte de los requisitos para la lectura del libro; sin 
embargo, el lector no debe descorazonarse si no capta completamente el signi- 
ficado de las ideas en su primera lectura: Estas ideas son importantes, pero al 
lector que no esté del todo familiarizado con ellas le será más fácil absorberlas 
si revisa la exposición de vez en cuando, mientras lee el texto propiamente. 

Las Secciones 4 y $ se refieren a las relaciones de equivalencia en el contexto 
del álgebra lineal. La Sección 4 contiene un breve estudio de los espacios co- 
cientes. Puede ser leido en cualquier oportunidad, después de los primeros 
dos o tres capitulos del libro. La Sección 5 trata brevemente algunas de las re- 
laciones de equivalencia que se presentan en el libro y pretende mostrar cómo 
algunos de los resultados del libro se pueden interpretar desde el punto de vista 
de las relaciones de equivalencia. La Sección 6 describe el axioma de elección 
y sus implicaciones para el álgebra lineal. 
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A.1. Conjuntos 


Usaremos las expresiones «conjunto», «clase», «colección» y «familiw» in- 
distintamente, aunque damos preferencia a «conjunto». Si S es un conjunto 
y x es un objeto del conjunto $, se dirá que x es un miembro de $, que x es un 
clemento de S, que x pertenece a S o simplemente que x está en S. Si S tiene 
solo un número finito de elementos, xX;,, ....x,. se suele enunciar S disponiendo 
sus elementos entre paréntesis: 


S = (L1, .... NN 
Asi el conjunto S de los enteros positivos de l a 5 será 
S= (1,2,3,4, 5). 


Si S y T son conjuntos, diremos que $ es un subconjunto de 7 O que $ cstá 
contenido en 7, si todo elemento de S es un elemento de 7. Todo conjunto $ es 
subconjunto de sí mismo. Si S es subconjunto de 7, pero S y T' no son idénticos, 
diremos que $ es subconjunto propio de 7. En otras palabras, S es subconjunto 
propio de T siempre que $ esté contenido en 7, pero T no esté contenido «<n $. 

Si S y T son conjuntos, la unión de S y 7' es el conjunto S U T que consta 
de todos los objetos x que son elementos de S o T. La intersección de S y T es 
el conjunto S (A T, que consta de todos los x que son elementos de S y de 7. 
Para dos conjuntos cualesquiera, S y T, la intersección S (7 T es un subcon- 
junto de la unión S U T. Esto debe contribuir a aclarar cl uso de la palabra «o» 
que prevalecerá en este libro. Cuando se dice que x está en S o en T,, no se ex- 
cluve la posibilidad de que x esté en ambos, S y T. 

Para que la intersección de S y T sea siempre un conjunto es necesario que 
se introduzca el conjunto vacío, es decir, el conjunto sin clementos. Entonces 
S NT es el conjunto vacío st, y solo si, S y T' no tienen elementos en común. 

A menudo se necesitará considerar la unión o intersección de varios con- 


n 

juntos. Si S,, ..., S, son conjuntos, su unión es el conjunto U $, que consta 
j-—1 

de todos los x que son elementos de al menos uno de los conjuntos S,,..., S,. 


n 
Su intersección es el conjunto ( $; que consta de todos los x que son elementos 
j=1 
de cada uno de los conjuntos S,. ..., S,. En unas pocas ocasiones tendremos 
que ver con la unión o intersección de una colección infinita de conjuntos. Debería 
quedar claro cómo tales uniones e intersecciones están definidas. El siguiente 


ejemplo aclarará estas definiciones y una notación para ellas. 


Ejemplo 1. Sea R el conjunto de todos los númcros reales (el eje real). 
Si £ está en R, se asocia con £ un subconjunto S, de R definido de la siguiente 
forma: $, consta de todos los números reales x que no son menores que /. 

(a) S, US,, = S,, donde 7 es el menor entre 1, y f>. 

(b) S, MS,, = S,, donde tf es el mayor entre £, y f>. 
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(c) Sea f el intervalo unidad, esto es, el conjunto de todos los t£ en R 
para los que O < £ < 1. Entonces 


U S: = So 


ten] 


8 S. = S1. 


tenf 


A.2. Funciones 


Una función consta de lo siguiente: 


(1) un conjunto X, llamado dominio de la función; 

(2) un conjunto Y, llamado codominio de la función; 

(3) una relación (o correspondencia) f. que asocia a cada elemento x de 
A un solo elemento f(x) de Y. 


Si (4, Y, f) es una función, se dice también que f es una función de X en Y. 
Esto no es del todo correcto, ya que no es f quien es la función; f es la ley de 
la función. Sin embargo, este uso del mismo simbolo para la función y su ley 
proporciona un medio mucho más manejable para hablar sobre funciones. Así 
se dirá que f es una función de X en Y, que X es el dominio de f y que Y 
es el codominio de f—-todo esto quiere decir que (X, Y, f) es una función como 
se definió anteriormente. Existen otras expresiones que comúnmente se usarán 
en lugar de «función». Algunas de éstas son «transformación», «operador» 
y «aplicación». Tales expresiones se usarán en contextos donde sean más apro- 
piadas en consideración al papel que debe desempeñar una función particular. 

Si f es una función de X en Y, el conjunto de imágenes (o imagen) de f es 
el conjunto de todos los f(x), con x de X. En otras palabras, la imagen de f 
consta de todos los elementos y de Y tales que y = f(x) para algún x de X. Si 
la imagen de f es todo Y, se dirá que f es una función de X' sobre Y o simple- 
mente que f es sobreyectiva. La imagen de f se representa a menudo por f(X'). 


Ejemplo 2. (a) Sea X el conjunto de los números reales y sea Y = X. 
Sea f la función de X en Y definida por f(x) = x?. La imagen de f es el con- 
junto de todos los números reales no negativos. Así que f no es sobreyectiva. 

(b) Sea X el plano euclidiano, e Y = X. Defínase f como sigue: si P es 
un punto del plano, entonces f(P) es el punto obtenido por rotación de P en 90 
(en torno al origen, en la dirección antirreloj). El recorndo de f es todo Y, es 
decir, el plano entero, y así f es sobreyectiva. 

(c) Sea otra vez X el plano euclidiano. Se introduce un sistema de coorde- 
nadas en X, como en geometría analítica, por medio de dos rectas perpendicu- 
lares para identificar los puntos de X con pares ordenados (x,, xz) de números 
reales. Sea Y el eje x,, esto es, todos los puntos (x,, x2) con x, = 0. Si P es un 
punto de X, sea f(P) el punto obtenido al proyectar P sobre el eje x,, parale- 
lamente al eje x,. Es decir, f(x, x2) = (x,, 0). La imagen de f es todo Y, por 
lo que f es sobreyectiva. 
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(d) Sca X el conjunto de los números reales y seca Y el conjunto de los nú- 
meros reales positivos. Se define una función f de X en Y por f(x) = e”. Enton- 
ces f es una función de X sobre Y. 

(e) Sean X el conjunto de los números reales positivos e Y el conjunto 
de los números reales. Sea f la función logaritmo natural, esto es, la función 
definida por f(x) = log x = ln x. Aquí también f es sobreyectiva, es decir, 
todo número real es el logaritmo natural de algún número positivo. 


Supóngase que X, Y y Z sean conjuntos, que f sea una función de X en Y y 
que g sea una función de Y en Z. Existe una función g >» f de X en Z asociada 
con f y g, llamada composición de g y f. Está definida por 


(lg > PG) = gU(x)). 


Como un ejemplo simple, sea Y = Y = Z el conjunto de los números reales, 
sean f, g, h las funciones de X en Y definidas por 


fo)=2 gqa)=*e ha=e” 


y entonces h =.g0 f. La composición go f se representa a menudo simple- 
mente por gf; sin embargo, como indica el ejemplo anterior, hay veces en que 
esto se presta a confusiones. 

Un problema de interés es el siguiente. Supóngase que f' es una función 
de X en Y. ¿Cuándo existe una función g de Y en X tal que g(f(x)) = x para todo 
x de X'? Si se representa por / la función identidad en YX, esto es, la función de X' en 
X definida por M(x) = x, se pregunta: ¿cuándo existe una función g de Y en 
X tal que go f = 1? En forma somera, se quiere una función g que «envíe cada 
elemento de Y al sitio de donde proviene». Para que tal función g exista, f debe 
ser evidentemente inyectiva, esto €s, f debe tener la propiedad de que si x, + x,, 
entonces f(x,) + f(x,). S1 f es inyectiva, tal función g existe. Se la define como 
sigue: sea y un elemento de Y. Si y está en la imagen de f, entonces existe un 
elemento x de X tal que y = f(x); y como f es inyectiva, existe exactamente 
un x con esa propiedad. Se define g(y) = x. Si y no está en la imagen de f se 
define g(y) como cualquier elemento de X. Obviamente tenemos entonces que 
gof =1L Z 

Sea f una función Y en Y. Se dice que f es inversible si existe una función 
g de Y en X' tal que . 


(1) go f es la función identidad en X, 
(2) fog es la función identidad en Y. A 


Acabamos de ver que si existe una función g que satisface (1), entorices f es 
inyectiva. En forma semejante se puede ver que si existe una g que satisface (2), 
la imagen de f es todo Y, es decir, f es sobreyectiva. Asi, si f es inversible, f es 
inyectiva y sobreyectiva. Reciprocamente, si f es inyectiva y sobreyectiva, existe 
una función g de Y en X que satisface (1) y (2). Además, esta g es única. Es la 
función de Y en X' definida por esta ley; si y está en Y, entonces g(y) es el único 
elemento x en X para el que f(x) = y. 
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Si f es inversible (myectiva y sobreyectiva), la recíproca de f es la función 
única f * de Y en X que cumple: 


(10 F UY) = x para cada x en X, 
(2) 0) = y para cada y en Y. 


Ejemplo 3. Considérense las funciones del Ejemplo 2. 


(a) Si X = Y, el conjunto de los números reales, y f(x) = x*, entonces 
f no es inversible. En efecto, f no es inyectiva ni sobreyectiva. 

(b) Si X = Y, el plano euclidiano, y f es la «rotación de 90», entonces 
f'es inyectiva y sobreyectiva. La función recíproca f”* es la «rotación de — 907» 
o la «rotación de 270”». 

(c) Si X es el plano, Y el eje x,, y f(x,. x2) = (x,, 0), entonces f no es in- 
versible. En efecto, f es sobreyectiva, pero f no es inyectiva. 

(d) Si X es el conjunto de los números reales, Y el conjunto de los núme- 
ros reales positivos y f(x) = e*, entonces f es inversible. La función f”* es 
la función logaritmo natural de la parte (e): log e” = x, el = y. 

(e) La recíproca de esta función logaritmo natural es la función expo- 
nencial de la parte (d). 


Sea f una función de X' en Y y sea f, una función de X¿ en Y,. Se dice que 
f, es una restricción de f (o una restricción de f a Xp) si 


(1) X¿ es un subconjunto de X, 
(2) folx) = f(x) para todo x de Xo¿. 


Por supuesto, que cuando f, es una restricción de f, se sigue que Y, es un sub- 
conjunto de Y. El nombre de «restricción» viene del hecho de que f y f, tienen 
la misma ley, y difieren principalmente porque se ha restringido el dominio 
de definición de la ley a un subconjunto X, de X. 

Si hemos dado la función f y cualquier subconjunto X, de X. hay una forma 
obvia para construir una restricción de f a X,. Definimos una función f, de 
XxX, en Y por folx) = f(x) para todo x de X,. Podríamos preguntarnos por qué 
no decimos que esta es la restricción de f a X¿. La razón es que cuando se dis- 
cuten las restricciones de f se desea tener libertad para cambiar el codominio 
Y. al igual que el dominio X. 


Ejemplo 4. (a) Sea X el conjunto de los números reales y f la función 
de X en X definida por fíx) = x?. Entonces f no es una función inversible, 
pero lo es si se restringe su dominio al de los números reales no negativos. Sea 
Xo el conjunto de los números reales no negativos y sea f, la función de Xo 
en X, definida por fo(x) = x?. Entonces f, es una restricción de f a X,¿. Pero 
f no es inyectiva ni sobreyectiva. mientras que f, es myectiva y sobreyectiva. 
La última afirmación solo dice que todo número no negativo es raíz cuadrada 
de un número no negativo precisamente. La función recíproca f, * es la función 
de X, en X, definida por f, *(x) = YX. 

(b) Sea X' el conjunto de los números reales y sea f la función de X en X 
definida por /(x) = x? + x? + 1. La imagen de f es todo Y y f es sobreyectiva. 
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La función f obviamente no es inyectiva. v.gr., f(— 1) = /(0). Pero / es imycc 
tiva en X,, conjunto de los números reales no negativos, ya que la derivada 
de f es positiva para x > 0. Cuando x recorre todos los números no negativos. 
fix) recorre todos los números reales + tales que r > 1. St se hace que Y, seu 
el conjunto de todos los y > 1 y que f,, sea la función de X, en Y. definida 
por folx) = f(x), entonces f, es una función inyectiva de X,, sobre Y,. Con- 
secuentemente, f, tiene una función reciproca f,' de Y, en X,¿. Cualquier 
fórmula para fo '(y) es bastante complicada. 

(c) Sea otra vez X el conjunto de los números reales y sea f la función 
seno, esto es, la función de X en YX definida por f(x) = sen x. La imagen de 
f es el conjunto de todos los y tales que —1 < y < l: luego f no es sobreyec- 
tiva. Como f(x + 21) = f(x), vemos que f no es inyectiva. Si se hace que Y, 
sea el intervalo — 1/2 < x < x/2. entonces f es inyectiva en AX. Sea Y, el in- 
tervalo —1 < y < l y sea fo la función de X, en Y, definida por fo(x) = sen x. 
Entonces f,¿ es una restricción de f en el intervalo X, y f¿ es inyectiva y sobre- 
yectiva. Esta es otra forma de decir que. en el intervalo de — 7/2 a rn 2, la función 
seno toma todo valor entre —1 y | exactamente una vez. La función fo! es 
la función recíproca del seno: 


fo (y) = sen”?! y = arc sen y. 


(d) Este es un ejemplo general de restricción de una función. Es un ejem- 
plo mucho más característico de los tipos de restricciones que se usarán en este 
libro, que los anteriores ejemplos (b) y (c). El ejemplo (a) es in caso especial 
de éste. Sea X un conjunto y f una función de X' en si mismo. Sea X, un sub- 
conjunto de A”. Se dice que X, es invariante por f si para todo x de Y, el elemento 
J(x) está en Xy. Si X, es invariante por f, entonces f induce una función f¿ de 
X¿ en sí mismo, por restricción del dominio de su definición a Xp. La impor- 
tancia de la invariancia es que por restricción de f a X, se puede obtener una 
función de X,¿ en sí mismo, más bien que simplemente una función de 
X, en X. 


A.3. Relaciones de equivalencia 


Una relación de equivalencia es un tipo especifico de relación entre pares 
ordenados de elementos en un conjunto. Para definir una relación de equivalen- 
cia debemos ver primero qué se entiende por «relación». 

Ciertamente, una definición formal de «relación» debería comprender re- 
laciones familiares como «x = y», «x < y», «xv es la madre de v» y «x es de 
más edad que ». Si X' es un conjunto. ¿qué es lo que determina una relación 
entre los pares de elementos de X? Lo que se necesita, evidentemente, es una 
ley para determinar si. para dos elementos dados cualesquiera x e r de X, y 
está o no en la correspondencia dada con 1. Esa ley R se la llama una relación 
(binaria) en X. Si queremos ser más precisos se puede proceder como sigue. 
Sea X x X' el conjunto de todos los pares ordenados (x. 1) de elementos en A. 
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Una relación binaria en Y es una función K de X x X en el conjunto (0, 1). 
Esto cs, R asigna a cada par ordenado (x, y) el valor 1 o 60. La idea cs que st 
R(x, v) = 1. entonces x está en la correspondencia dada con y, y si R(x, y) = 0, 
no lo está. 

Si R es una relación binaria en el conjunto X es conveniente escribir xRy 
cuando Rí(x, y) = 1. Una relación binaria R se dice 


(1) reflexiva, si xRx para todo x de A; 
(2) simétrica, sí vRx toda vez que xRy; 
(3) transitiva, si xRz toda vez que xRy y yRo. 


Una relación de equivalencia en X' es una relación binaria en X' que es reflexiva, 
simétrica y transitiva. 


Ejemplo 5. (a) En cualquier conjunto la igualdad es una relación de equi- 
valencia. En otras palabras, si xRvy quiere decir x = y, entonces R es una re- 
lación de equivalencia. En efecto, x = x, SI x = y entonces y = X, SI x= y 
e y = z entonces x = 7. La relación «x + y» es simétrica, pero no es reflexiva 
ni transitiva. 

(b) Sea X el conjunto de los números reales y supóngase que xRy quiere 
decir x < y. Entonces R no es una relación de equivalencia: es transitiva, pero 
no es reflexiva ni simétrica. La relación «x < y» es reflexiva y transitiva, pero 
no es simétrica. 

(c) Sea E£ el plano euclidiano y sca X el conjunto de todos -los triángulos 
del plano E. Entonces la congruencia es una relación de equivalencia en X; 
esto €s, «47, = T,» (T, es congruente con 7,) es una relación de equivalencia 
en el conjunto de todos los triángulos en el plano. 

(d) Sea X el conjunto de todos los enteros 


-,-2-1,0,1,2.... 


Sea n un entero positivo fijo. Se define una relación R, en X por: xR, y si, y solo si, 
(x — y) es divisible por n. La relación R, se llama congruencia módulo ». En 
vez de xR, yr es corriente escribir 


x = y, mód +1 (x es congruente a y módulo »n) 


cuando (x — y) es divisible por ». Para cada entero positivo rn. la congruencia 
módulo nr es una relación de equivalencia cn el conjunto de los enteros. 

(c) Sean X e Y conjuntos y f una función de X en Y. Se define una rela- 
ción Ren X por: x,Rx, sí, y solo st, f(x) = f(x). Es fácil verificar que R es 
una relación de equivalencia en el conjunto X. Como se verá, este ejemplo par- 
ticular comprende en realidad todas las relaciones de equivalencia. 

Supóngase que R us una relación de equivalencia en el conjunto X. Si .x 
es el elemento de A. Elx; R) representa el conjunto de todos los elementos y 
de X tales que xRy. Este conjunto E(x; R) se llama la clase de equivalencia de 
x (para la relación de equivalencia R). Como R es una relación de equivalencia, 
fas clases de equivalencia tienen las siguientes propiedades: 
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(1) Todo Ex; R) es no vacio; en efecto, como vRy, el clemento x perte- 
nece a E(x; R). 

(2) Sean x e y elementos de X. Como R es simétrica, y pertenece a E(x: R) 
s1, y solo si, x pertenece a E( y; R). 

(3) Si xe y son elementos de X, las clases de equivalencia E(x; R) y El v; R) 
o son idénticas o no tienen elementos en común. Primero supóngase que xRp. 
Sea z cualquier elemento de E(x; R), es decir, un elemento de Y tal que xR-. 
Como R es simétrica, se tiene que zRx. Por hipótesis, xRy, y puesto que R es 
transitiva, se tiene zRy o yRz. Esto muestra que todo elemento de E(x; R) es 
elemento de E( y; R). Por la simetría de R, del mismo modo podemos ver que 
todo elemento de E(y; R) es elemento de E(x; R); luego E(x; R) = Ef y: R). 
Ahora bien, se «firma que si la relación xRy no es válida, entonces E(x; R) NA 
E(y; R) es vacio. En efecto, si z está en ambas de estas clases de equivalencia 
tenemos que xRz e yRz, o sea xRz y zRy. luego xRy. 


Si $ representa una familia de clases de equivalencia para la relación de 
equivalencia R, vemos que: (1) todo conjunto de la familia $ es no vacío, (2) todo 
elemento x de X pertenece a uno, y solo uno, de los conjuntos de la familia $, 
(3) xRy si, y solo si, x e y pertenecen al mismo conjunto en la familia $. En re- 
sumen, la relación de equivalencia R subdivide a X en la unión de una familia 
de subconjuntos (no vacios) que no se solapan. El razonamiento es también 
válido a la inversa. Supóngase que $ es una familia de subconjuntos de X' que 
satisfacen las condiciones (1) y (2) anteriores. Si se define una 1elación R por (3), 
entonces R es una relación de equivalencia sobre X y $ es la familia de clases de 
equivalencia segun R. 


Elemplo 6. Veamos cuáles son las clases de equivalencia según las rela- 
ciones de equivalencia en el Elemplo $. 


(a) Si R es la igualdad en el conjunto X. entonces la clase de equivalencia 
del elemento x es simplemente el conjunto (xj, cuyo único elemento es x. 
= (b) Si X es el conjunto de todos los triángulos en el plano y R es la relación 
de congruencia, todo lo que se puede decir en principio es que la clase de equiva- 
lencia del triángulo 7 consta de todos los triángulos que son congruentes con 7. 
Uno de los objetivos de la geometría plana es dar otras descripciones de estas 
clases de equivalencia. 

(c) St X' es el conjunto de los enteros y R,, es la relación «congruencia mó- 
dulo »», entonces hay precisamente n clases de equivalencia. Cada entero x se 
puede expresar univocamente en la forma x = qn + r, donde q y r son enteros 
y0<r<n-— 1. Esto muestra que cada x es congruente módulo rn a uno pre- 


cisamente de los n enteros 0, 1, 2, ...,n — 1. Las clases de equivalencia son 
Es =4..., —2n, —n,0,n, 2n,...) 
E, = 


f[...,1->2n1-—02n1+nmn,1+2n,...) 


ELa=£..,n-1-2n—1-22n-1n-1>+n 
n—-1+%n.,...). 
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(d) Supóngase que Y e Y son conjuntos, f una función de X en Y y Res 
la relación de equivalencia definida por x,Rx, sí, y solo si f(x,) = f(x). Las 
clases de equivalencia según R son los mayores subconjuntos de X' en los que f 
es «constante». Otra descripción de las clases de equivalencia es ésta: están en 
correspondencia biuníivoca con los elementos de la imagen de f. Si y está en la 
imagen de f, el conjunto de todos los x de X tales que f(x) = y es una clase de 
equivalencia según R; y esto define una correspondencia biunivoca entre los 
elementos de la imagen de f y las clases de equivalencia de R. 

Un comentario más respecto a las relaciones de equivalencia. Dada una 
relación de equivalencia en X, sea Y la familia de las clases de equivalencia 
según R. La asociación de la clase de equivalencia E(x; R) con el elemento x 
define una función f de X en $ (en realidad, sobre $): 


Hx) = Elx; R). 


Esto muestra que R es la relación de equivalencia asociada a una función cuyo 
dominio es AX, como en el Ejemplo $5(e). Lo que esto indica es que toda relación 
de equivalencia en el conjunto X está determinada como sigue: Se tiene una 
ley (función) f que asocia a cada elemento x de X' un objeto f(x), y xRy si, y solo 
si f(x) = f(y). Ahora debe pensarse en f(x) como una propiedad de x, de modo 
que lo que la relación de equivalencia hace (someramente hablando) es reunir 
a todos aquellos elementos de X que tienen esta propiedad en común. Si el ob- 
jeto f(x) es la clase de equivalencia de x, entonces todo lo qu” se ha dicho es 
que la propiedad común de los elementos de una clase de equivalencia es que 
pertenecen a la misma clase. Claro es que esto no dice mucho. Por lo general, 
hay muchas funciones diferentes, f, que determinan, cómo se hace antes, 
la relación de equivalencia dada, y un objetivo en el estudio de las relaciones 
de equivalencia es hallar una f tal que dé una descripción elemental y con sen- 
tido de la relación de equivalencia. En la Sección A.5 veremos cómo se hace 
esto para algunas relaciones de equivalencia especiales que aparecen en el álge- 
bra lineal. 


A.4. Espacios cocientes 


Sea V un espacio vectorial sobre el cuerpo F y sea W un subespacio de Y. 
Hay en general muchos subespacios W* que son complementarios de W, es 
decir, subespacios con la propiedad de que Y = WO W”..Si tenemos un pro- 
ducto interior sobre V, y W es de dimensión finita, hay un subespacio particular 
que se podría llamar, probablemente, subespacio complementario «natural» 
de W. Este es el complemento ortogonal de W. Pero st V no tiene otra estructura 
fuera de su estructura de espacio vectorial, no hay modo de seleccionar un sub- 
espacio W” que se pudiera llamar subespacio complementario natural de W. 
Sin embargo, se puede construir a partir de Y y W un espacio vectorial V/W, 
llamado «cociente» de Y y W, que hará de complemento natural de W. Este 
espacio cociente no es un subespacio de V y, por tanto, no puede ser un subes- 
pacio complementario de W; pero es un espacio vectorial definido solo en tér- 
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minos de V y W y tiene la propiedad de que es isomorfo a Cualquier subespacio 
W”* que sea complementario de W. 

Sea W un subespacio de un espacio vectorial V. Si a y $f son vectores en V, 
se dice que a es congruente con ff módulo W si el vector (a — f) está en el subes- 
pacio W. Si a es congruente con f módulo W, se escribirá 


a = PM, mód W. 


Ahora bien, la congruencia módulo W es una relación de equivalencia sobre Y. 


(1) a = «a, mód W, pues a — a = 0 está en W. 

(2) Si a = f, mód W, entonces f| = a, mód W. En efecto, como W es 
un subespacio de Y, el vector (a — fB) está en W si, y solo si, ($ — xa) está en W. 

(3) Si a = f8, mód W y f$ = y, mód W, entonces a = y, mód W. En efec- 
to, si (a — f) y (f — y) están en W, entonces a — y = (a — f$) + (B — y) 
está en W. 


Las clases de equivalencia de esta relación de equivalencia se llaman clases 
laterales de W. ¿Cuál es la clase de equivalencia (clase lateral) de un vector a? 
Consta de todos los vectores ff de V tales que (ff — a) está en W; esto es, todos 
los vectores f de la forma f = a + y, con y en W. Por esta razón la clase lateral 
del vector a se representa por 


a+ W. 


Es apropiado pensar que la clase lateral de a con respecto a W es el conjunto 
de los vectores que se obtienen por traslación del subespacio W por el vector «. 
Para ilustrar estas clases laterales, el lector podría pensar en el siguiente caso 
especial. Sea V el espacio R? y sea W un subespacio unidimensional de Y. Si 
se considera Y como un plano euclidiano, W es una recta por el origen. Si a = 
(x 1, x2) es un vector en V, la clase lateral a + W es la recta que pasa por el punto 
(x,, x2) y es paralela a W. 

La colección de todas las clases laterales de W se representará por V/W. 
Definimos ahora una adición vectorial y una multiplicación por un escalar 
en V/W como sigue: 


(a + W) + (8 + W) = (a+ 6) + W 
cla + W) = (ca) + W. 


En otras palabras, la suma de la clase lateral de a y la clase lateral de f! es la clase 
lateral de (a + $) y el producto del escalar c y de la clase lateral de a es la clase 
lateral del vector ca. Ahora bien, muchos vectores diferentes de V tendrán la 
misma clase lateral con respecto a W y, por tanto, se debe verificar que la suma 
y el producto anterior dependen solo de las clases laterales que intervienen. 
Lo que esto quiere decir es que debemos demostrar lo siguiente: 


(a) Si a = a”, mód W y f = f", mód W, entonces 


a+p=a + $", mód W. 
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(2) Si a = a”, mód W, entonces ca = ca”, mód W. 


Estos hechos son fáciles de verificar. (1) Si a — a' está en W y f — fP” está 
en W, entonces como (a + fB) — (a + PB) = (a — a) + (B — $”), vemos que 
1 + fá es congruente con a” + f8" módulo W. (2) Si a — a está en W y c cual- 
quier escalar, entonces ca — ca" = cla — a”) está en W. 

Es ahora fácil de verificar que V/W, con la adición vectorial y la multipli- 
cación por escalares definidos anteriormente, es un espacio vectorial sobre el 
cuerpo F. Debemos comprobar directamente cada uno de los axiomas para un 
espacio vectorial. Cada una de las propiedades de la adición vectorial y de la 
multiplicación por escalares se desprenden de la correspondiente propiedad 
de las operaciones en V. Habría que decir que el vector nulo de V/W será la 
clase lateral del vector nulo de V. Es decir, W es el vector nulo de V/W. 

El espacio vectorial V/W se llama cociente (o diferencia) de Y y W. Hay 
una transformación lineal natural O de V sobre V/W. Está definida por O(a) = 
o + W. Debemos notar que se han definido las operaciones en V/W justamente 
para que esta transformación O sea lineal. Obsérvese que el espacio nulo de Q 
es exactamente el subespacio W. Se llama a O la transformación cociente (o 
aplicación cociente) de Y sobre V/W. 

La relación entre el espacio cociente V/W y los subespacios de Y que son 
complementarios de W puede ser ahora establecida como sigue.* / 

ransfor- 


Teorema. Sea W un subespacio del espacio vectorial V y sea O la 
mación cociente de V sobre V/W. Supóngase que W' es un subespacio de V. Enton- 
ces V= WO W si, y solo si, la restricción de O a W' es un isomorfismo de W' 
sobre V/W. 


Demostración. Supóngase que Y = W Q W”. Esto quiere decir que cada 
vector a de V está univocamente expresado en la forma a = y + y”, con y en W 
y y" en W”. Entonces Qa = Oy + Oy” = Qy', esto es, a + W = y” + W. Esto 
muestra que O aplica W” sobre V/W, es decir, que Q(W”) = V/W. También 
O es inyectiva en W”; en efecto, supóngase que y; y y, Sean vectores en W” y 
que Oy; = Qy;. Entonces O(y; — y2) = 0, con lo que y; — y, están en W. 
Este vector está también en W”, que es disjunto de W; luego y; — y2 = 0. La 
restricción de Q:a W' es, por tanto, una transformación lineal inyectiva de W* 
sobre V/W. o 

Supóngase que W” es un subespacio de V tal que O sea inyectiva en W” y 
que O(W) = V/W. Sea a un vector de V. Entonces existe un vector y” de W' 
tal que Qy' = Ox; es dectr, y" + W = a + W. Esto quiere decir que a = y + y” 
para algún vector y en W. Por tanto, V = W + W”. Para ver que W y W” son 
disjuntos, supóngase que y está en W y W”. Como y está en W, se tiene Oy = 0. 
Pero O es inyectiva en W”, y entonces debemos tener que y = O Por tanto, 
tenemos que V= WOW". ] 


Lo que realmente dice este teorema es que W” es complementario de W si, 
y solo si, W' es un subespacio que contiene exactamente un elemento de cada 
clase lateral de W. Muestra que cuando V= WGQ W', la transformación 
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cociente O «identifica» W* con V/W. En resumen, (W O W'YW es isomorfo 
de W” de un modo «natural». 

Otro hecho obvio debemos notar. Si W es un subespacio del espacio vec- 
torial de dimensión finita V, entonces 


dim W + dim (V/W) = dim V. 


Se puede ver esto del teorema anterior. Tal vez es más fácil observar que lo que 
esta fórmula dimensional dice es que 


nulidad (O) + rango (O) = dim Y. 


No es nuestro propósito hacer aquí un tratamiento detallado de los espa- 
cios cocientes. Pero hay un resultado fundamental que se demostrara. 


Teorema. Seun V y Z espacios vectoriales sobre el cuerpo F. Supóngase 
que T es una transformación lineal de V sobre Z. Si W es el espacio nulo de T, 
entonces Z es isomorfo a V/W. 


Demostración. Definimos una transformación U de V/W en Z por 
U(a + W) = Ta. Debemos verificar que U está bien definida, es decir, que 
si a + W= $ + W, entonces Ta = Tff. Esto se desprende del hecho de que 
W es el espacio nulo de T; en efecto, a + W = f + W quiere decir que a — $ 
está en W, y esto sucede si, y solo si, T(a — f) = O. Esto muestra no solo que 
U está definida, sino que también U es inyectiva. 

Es ahora fácil comprobar que U es lineal y aplica V/W sobre Z, pues T es 
una transformación lineal de V sobre Z. | 


A.5. Relaciones de equivalencia 
en Algebra Lineal 


Consideraremos algunas de las relaciones de equivalencia que aparecen 
en el texto de este libro. Este es apenas una muestra de tales relaciones. 


(1) Sean m y n enteros positivos y F un cuerpo. Sea X' el conjunto de todas 
las matrices m x n sobre F. Entonces la equivalencia por filas es una relación 
de equivalencia en el conjunto X. La afirmación «4 es equivalente por filas 
a B» quiere decir que A se puede obtener de B por una sucesión finita de ope- 
raciones elementales por filas. Si escribimos A -— B por «4 es equivalente por 
fila a B», entonces no es dificil comprobar las propiedades (1) A - A; (1) si 
A “ B, entonces B = A; (11) si A- By B-C, entonces A = C. ¿Qué se 
sabe de esta relación de equivalencia? En realidad se sabe mucho. Por ejem- 
plo, se sabe que A - B si, y solo si, 4 = PB para cierta matriz inversible m x m, P; 
o A - Basi, y solo si, el sistema homogéneo de ecuaciones lineales AX = 0 
y BX = 0 tienen las mismas soluciones. También se tiene información explícita 
respecto a las clases de equivalencia para esta relacion. Cada matriz m x n, A, 
es equivalente por filas a una, y solamente una, matriz escalón reducida por 
filas. Lo que esto dice es que cada clase de equivalencia, según esta relación, 
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contiene precisamente una matriz escalón reducida por filas, R; la clase de 
equivalencia determinada por R consta de todas las matrices A = PR donde 
P es una matriz inversible m x m. También se puede pensar en esta descripción 
de las clases de equivalencia del siguiente modo. Dada una matriz m x n, A, 
tenemos una ley (función) f que asocia con A la matriz escalón reducida por 
filas f(4) que es equivalente por filas a 4. La equivalencia por filas está comple- 
tamente determinada por f. En efecto, A - B si, y solo si, f(4) = f(8B), es 
decir, si, y solo si, 4 y B tienen la misma forma escalón reducida por filas. 

(2) Sea n un entero positivo y F un cuerpo. Sea X' el conjunto de todas las 
matrices n x n sobre F. Entonces la semejanza es una relación de equivalencia 
en X; toda matriz. n x n, Á, es semejante a sí misma; si Á es semejante a B, 
entonces B es semejante a A; si Á es semejante a B y B es semejante a C, enton- 
ces A es semejante a C. Sabemos también bastante de esta relación de equi- 
valencia. Por ejemplo, A es semejante a B si, y solo si, A y B representan el mismo 
operador lineal sobre F” en (posiblemente) diferentes bases ordenadas. Pero 
se sabe algo más profundo que esto. Toda matriz n x n, A, sobre F es semejante 
(sobre F) a una, y solo a una, matriz que está en la forma racional (Capítulo 7). 
En otras palabras, cada clase de equivalencia, según la relación de semejanza, 
contiene precisamente una matriz que está en la forma racional. Una matriz 
en la forma racional está determinada por un k-tuple (p,, ..., pn) de polino- 
mios mónicos que tienen la propiedad de que p;,, divide ap, j=1,...,k-—1. 
Asi, se tiene una función f que asocia a cada matriz n x n, A, un k-tuple f(4) = 
(Pi, - . - , Pi) que satisface la condición de divisibilidad de que p;,, divide a p,. 
Y, A y B son semejantes si, y solo si, f(4) = f(B). 

(3) He aquí un caso especial del anterior Ejemplo 2. Sea X el conjunto 
de las matrices 3 x 3 sobre el cuerpo F. Se considera la relación de semejanza 
en X. Si A y B son matrices 3 x 3 sobre F, entonces A y B son semejantes si, y 
solo si, tienen el mismo polinomio característico y el mismo polinomio minimal. 
Asociado a cada matriz 3 x 3, A, se tiene un par de polinomios mónicos (p, q) 
que satisfacen 


(a) grd f = 3; 
(b) p divide f; 


siendo f el polinomio característico para A y p el polinomio minimal para A. 
Dados los polinomios mónicos f y p sobre F, que cumplen (a) y (b), es fácil 
encontrar una matriz 3 x 3 sobre F que tiene a f y a p como sus polinomios 
característico y minimal, respectivamente. Lo que todo esto significa es que: 
Si se considera la relación de semejanza en el conjunto de las matrices 3 x 3 
sobre F, las clases de equivalencia están en correspondencia biunivoca con los 
pares ordenados (f, p) de polinomios mónicos sobre F que satisfacen (a) y (b). 


ÁA.6. El axioma de elección 


Someramente hablando, el axioma de elección es una regla (o principio) 
del pensamiento que dice que, dada una familia de conjuntos no vacíos, se 
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puede elegir un elemento de cada conjunto. Para ser más precisos, supóngase 
que se tenga un conjunto de índices Á y que para cada a de A se tenga un conjunto 
asociado S, no vacio. El «elegir» o «seleccionar» un elemento de cada S, quiere 
decir dar una regla f que asocie a cada a un elemento f(a) en el conjunto S,. 
El axioma de elección dice que esto es posible; es decir, dada la familia de con- 
juntos [S,), existe una función f de A en 


U Sa 


tal que f(x) está en S, para todo a. Este principio es aceptado por la mayoría 
de los matemáticos, pese a que surgen muchas situaciones en las que está lejos 
de ser claro cómo se pueda hallar una función explicita f. 

El axioma de elección tiene consecuencias sorprendentes. La mayoría de 
las cuales tienen poca o ninguna influencia en el material de este libro; sin em- 
bargo, es digna de mencionar una: todo espacio vectorial tiene una base. Por 
ejemplo, el cuerpo de los números reales tiene una base, considerado como 
espacio vectorial sobre el cuerpo de los racionales. Es decir, existe un subconjun- 
to S de R que es linealmente independiente sobre el cuerpo de los racionales 
y tiene la propiedad de que cada número real es una combinación lineal racional 
de un número finito de elementos de S. No nos detendremos aquí a derivar 
este espacio vectorial que results de la aplicación del axioma de elección. Para 
una demostración, el lector puede consultar el libro de Kelley citado en la bi- 
bliografía. 
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propio, 381 
Subcuerpo, 2 
Subespacio, 34 
anulador de un, 100 
cíclico, 226 
cociente, 390 
complementario, 230 
complementario ortogonal, 282 
generado, 36 
independiente, 208 
invariante, 197, 205, 310 
nulo, 35 
T-admisible, 231 
Subespacios, suma de, 37 
Sucesión de vectores, 47 
Submatriz (Ej. 9), 162 
Suma: 
de subespacios, 37 
directa, 209 


T-admisible, subespacio, 231 
T-anulador, 200, 201, 227 
T-conductor, 200, 201, 231 
Taylor, fórmula de, 128, 264 
Tensorial, producto, 166 
Teorema fundamental del álgebra, 136 
Transformación: 

cero, 67 
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Transformación: 

de derivación, 67 
Transformación (operador) lineal, 67, 76 
adjunta, 292 

autoadjunta, 295, 310 

cociente, 389-90 

descomposición cíclica de la, 232 
descomposición polar de la, 338 
determinante de la, 171 
diagonalizable, 183 

imagen por la, 71 

invertible, 79 

matriz de la, 87, 88 

matriz de la, en la base normal, 291 
nilpotente, 220 

no negativa, 325, 336 

no singular, 79 

normal, 309 

nulidad de la, 71 

ortogonal, 301 

parte diagonalizable de la, 220 
polinomio minimal de la, 190 
positiva, 324 

rango de la, 71 

semisimple, 261 

transpuesta de la, 111 
triangulable, 201, 312 
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